Thesis (Selection of subject)Thesis (Selection of subject)(version: 368)
Thesis details
   Login via CAS
Generating text from structured data
Thesis title in Czech: Generování textu ze strukturovaných dat
Thesis title in English: Generating text from structured data
Key words: generování textu|strukturovaná data|zpracování přirozeného jazyka|neuronové sítě
English key words: text generation|structured data|natural language processing|neural networks
Academic year of topic announcement: 2020/2021
Thesis type: Bachelor's thesis
Thesis language: angličtina
Department: Institute of Formal and Applied Linguistics (32-UFAL)
Supervisor: Mgr. Rudolf Rosa, Ph.D.
Author: hidden - assigned and confirmed by the Study Dept.
Date of registration: 22.12.2020
Date of assignment: 24.03.2021
Confirmed by Study dept. on: 12.04.2021
Date and time of defence: 02.07.2021 09:00
Date of electronic submission:27.05.2021
Date of submission of printed version:27.05.2021
Date of proceeded defence: 02.07.2021
Opponents: Ing. Zdeněk Kasner
Cílem práce je prozkoumat možnosti transformace strukturovaných tabulkových dat do přirozeného jazyka.

Úlohou je vytvoření modelu, jehož vstupem jsou strukturovaná data o sportovním zápase, a výstupem je textový popis zápasu v přirozeném jazyce, popisující například jednotlivé momenty zápasu a/nebo shrnující průběh celého zápasu.

Předpokládá se využití vhodných state-of-the-art metod založených na umělých neuronových sítích, nejspíše LSTM či GRU s mechanismem attention nebo Transformer.
CHEN, Zhiyu, et al. Few-shot nlg with pre-trained language model. ACL 2020.

WISEMAN, Sam; SHIEBER, Stuart M.; RUSH, Alexander M. Challenges in data-to-document generation. EMNLP 2017.

LEBRET, Rémi; GRANGIER, David; AULI, Michael. Neural text generation from structured data with application to the biography domain. arXiv preprint arXiv:1603.07771, 2016.
Charles University | Information system of Charles University |