Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Generování krátkých souhrnů fotbalových zápasů v češtině ze strukturovaných dat
Název práce v češtině: Generování krátkých souhrnů fotbalových zápasů v češtině ze strukturovaných dat
Název v anglickém jazyce: Generating Short Summaries of Football Matches in the Czech Language from Structured Data
Klíčová slova: Generování, strukturovaná data, souhrn informací, specifická doména
Klíčová slova anglicky: Generating, structured data, short summaries, specific domain
Akademický rok vypsání: 2016/2017
Typ práce: bakalářská práce
Jazyk práce:
Ústav: Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel: doc. RNDr. Vladislav Kuboň, Ph.D.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 26.06.2017
Datum zadání: 26.06.2017
Datum potvrzení stud. oddělením: 28.06.2017
Zásady pro vypracování
In recent years the natural language generation has been a prominent field of computer science. There is an abundance of raw data waiting to be interpreted and the most intuitive and comprehensive way for the reader is the natural language. We will focus on creating a system working with a restricted domain, specifically the domain of short summaries of football matches. The main goal of the thesis is to develop a system that will construct a short summary of a football match in the Czech language given the structured data of the said match.

As a part of the main goal, a glossary of phrases and words typical for this domain will be created in a manual or semi-automatic way and used to improve the lexical choice. A possibility of using aggregation techniques and references based on ontological hierarchy to better mimic the natural style of written language will be investigated as well. For various subtasks we will use linguistic tools available in the LINDAT repository.
Seznam odborné literatury
REITER, E., & DALE, R. (1997). Building applied natural language generation systems. *Natural Language Engineering,* *3*(1), 57-87.

Razímová Magda, Žabokrtský Zdeněk: Morphological Meanings in the Prague Dependency Treebank 2.0. In: Lecture Notes in Computer Science, Vol. 3658, Proceedings of the 8th International Conference, TSD 2005, Copyright © Springer, Berlin / Heidelberg, ISBN 3-540-28789-2, ISSN 0302-9743, pp.148-155, 2005

Ptáček Jan: Two Tectogrammatical Realizers Side by Side: Case of English and Czech. In: *Fourth International Workshop on Human-Computer Conversation*, Copyright © The Companions consortium, Bellagio, Italy, 2008
 
Univerzita Karlova | Informační systém UK