Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Generování kvízových otázek do společenské hry iKnow
Název práce v češtině: Generování kvízových otázek do společenské hry iKnow
Název v anglickém jazyce: Generator of quiz questions for the iKnow game
Klíčová slova anglicky: natural question generation|automatic text summarization|natural language processing
Akademický rok vypsání: 2021/2022
Typ práce: bakalářská práce
Jazyk práce: čeština
Ústav: Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel: Mgr. Michal Novák, Ph.D.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 07.02.2022
Datum zadání: 07.02.2022
Datum potvrzení stud. oddělením: 26.04.2022
Zásady pro vypracování
Úkolem bakalářské práce je naprogramovat generátor kartiček do české verze společenské hry iKnow. iKnow je desková hra kombinující kvízové otázky z různých oblastí s jednoduchým sázením (detailní pravidla jsou k dispozici v [1]). Každá kartička sestává z vědomostní otázky, tří nápověd a odpovědi. Otázka ve hře iKnow je velmi stručná a obecná, následně upřesněna až pomocí max. tří nápověd, které může hráč dostat. Správná odpověď je opět stručná většinou v podobě jména, názvu, roku nebo termínu.

Generátor tak musí na základě mnoha textů umět generovat tyto pětice. Otázky a nápovědy budou ve formě plynulých českých vět. Tři nápovědy by ideálně měly být vybrány tak, aby vedly k jednoznačné odpovědi na otázku. Rovněž by měly být odstupňovány podle obtížnosti, tj. i na základě samotné poslední nápovědy by mělo být jednodušší uhodnout správnou odpověď než jenom s první nápovědou.

Texty, ze kterých se budou generovat otázky, budou extrahovány z české verze Wikipedie [2], přičemž na zpracování přirozeného jazyka komponenta může použít nástrojů jako UDPipe [3], MorphoDiTa [4], NameTag [5] atd. Komponenta bude kartičky generovat dávkově. Implementována bude v jazyce Python 3.
Seznam odborné literatury
[1] https://www.albi.cz/gallery/download/4976/
[2] https://dumps.wikimedia.org/cswiki/20210401/
[3] https://ufal.mff.cuni.cz/udpipe
[4] https://ufal.mff.cuni.cz/morphodita
[5] https://ufal.mff.cuni.cz/nametag/1

Související literatura:
[6] Tsurel, D., Pelleg, D., Guy, I., & Shahaf, D. (2017). Fun Facts: Automatic Trivia Fact Extraction from Wikipedia. Proceedings of the Tenth ACM International Conference on Web Search and Data Mining, 345–354. https://doi.org/10.1145/3018661.3018709
[7] Kwon, J., Kamigaito, H., Song, Y.-I., & Okumura, M. (2020). Hierarchical Trivia Fact Extraction from Wikipedia Articles. Proceedings of the 28th International Conference on Computational Linguistics, 4825–4834. https://doi.org/10.18653/v1/2020.coling-main.424
[8] Tamura Y., Takase Y., Hayashi Y., Nakano Y.I. (2015) Generating Quizzes for History Learning Based on Wikipedia Articles. In: Zaphiris P., Ioannou A. (eds) Learning and Collaboration Technologies. LCT 2015. Lecture Notes in Computer Science, vol 9192. Springer, Cham. https://doi.org/10.1007/978-3-319-20609-7_32
[9] https://medium.com/@mjbaldwin/transforming-wikipedia-into-an-accurate-cultural-knowledge-quiz-b0a0f74877c
[10] El-Kassas, W., Salama, C., Rafea, A., & Mohamed, H. (2020). Automatic Text Summarization: A Comprehensive Survey. Expert Systems with Applications, 165, 113679. https://doi.org/10.1016/j.eswa.2020.113679
[11] Zhang, R., Guo, J., Chen, L., Fan, Y., & Cheng, X. (2021). A Review on Question Generation from Natural Language Text. ACM Trans. Inf. Syst., 40(1). https://doi.org/10.1145/3468889
 
Univerzita Karlova | Informační systém UK