Generating text from structured data
Thesis title in Czech: | Generování textu ze strukturovaných dat |
---|---|
Thesis title in English: | Generating text from structured data |
Key words: | generování textu|strukturovaná data|zpracování přirozeného jazyka|neuronové sítě |
English key words: | text generation|structured data|natural language processing|neural networks |
Academic year of topic announcement: | 2020/2021 |
Thesis type: | Bachelor's thesis |
Thesis language: | angličtina |
Department: | Institute of Formal and Applied Linguistics (32-UFAL) |
Supervisor: | Mgr. Rudolf Rosa, Ph.D. |
Author: | hidden - assigned and confirmed by the Study Dept. |
Date of registration: | 22.12.2020 |
Date of assignment: | 24.03.2021 |
Confirmed by Study dept. on: | 12.04.2021 |
Date and time of defence: | 02.07.2021 09:00 |
Date of electronic submission: | 27.05.2021 |
Date of submission of printed version: | 27.05.2021 |
Date of proceeded defence: | 02.07.2021 |
Opponents: | Ing. Zdeněk Kasner |
Guidelines |
Cílem práce je prozkoumat možnosti transformace strukturovaných tabulkových dat do přirozeného jazyka.
Úlohou je vytvoření modelu, jehož vstupem jsou strukturovaná data o sportovním zápase, a výstupem je textový popis zápasu v přirozeném jazyce, popisující například jednotlivé momenty zápasu a/nebo shrnující průběh celého zápasu. Předpokládá se využití vhodných state-of-the-art metod založených na umělých neuronových sítích, nejspíše LSTM či GRU s mechanismem attention nebo Transformer. |
References |
CHEN, Zhiyu, et al. Few-shot nlg with pre-trained language model. ACL 2020.
https://www.aclweb.org/anthology/2020.acl-main.18.pdf WISEMAN, Sam; SHIEBER, Stuart M.; RUSH, Alexander M. Challenges in data-to-document generation. EMNLP 2017. https://www.aclweb.org/anthology/D17-1239.pdf LEBRET, Rémi; GRANGIER, David; AULI, Michael. Neural text generation from structured data with application to the biography domain. arXiv preprint arXiv:1603.07771, 2016. https://github.com/DavidGrangier/wikipedia-biography-dataset |