Přeformuluj! - Webová hra, kde lidé soutěží ve schopnosti přeformulovat větu
Thesis title in Czech: | Přeformuluj! - Webová hra, kde lidé soutěží ve schopnosti přeformulovat větu |
---|---|
Thesis title in English: | Rephrase! - A web game where people show their sentence formulation skills |
Key words: | webová hra, větné parafráze, crowdsourcing, GWAP |
English key words: | web game, sentence paraphrases, crowdsourcing, GWAP |
Academic year of topic announcement: | 2013/2014 |
Thesis type: | Bachelor's thesis |
Thesis language: | čeština |
Department: | Institute of Formal and Applied Linguistics (32-UFAL) |
Supervisor: | doc. RNDr. Ondřej Bojar, Ph.D. |
Author: | hidden - assigned and confirmed by the Study Dept. |
Date of registration: | 04.01.2014 |
Date of assignment: | 09.07.2014 |
Confirmed by Study dept. on: | 15.07.2014 |
Date and time of defence: | 04.09.2014 00:00 |
Date of electronic submission: | 31.07.2014 |
Date of submission of printed version: | 31.07.2014 |
Date of proceeded defence: | 04.09.2014 |
Opponents: | doc. Mgr. Barbora Vidová Hladká, Ph.D. |
Guidelines |
Vztah mezi významem věty a konkrétní formulací je velice komplikovaný a větnou synonymii se dosud nepodařilo uspokojivě strojově modelovat. Úspěšnou strategií počítačové lingvistiky je napřed získat dostatečně objemná data, která úlohu ilustrují, a následně z nich odvodit zobecnění nebo na nich natrénovat algoritmy strojového učení.
Cílem bakalářské práce je připravit podmínky pro studium synonymie vět, tj. vytvořit nástroj, s jehož pomocí získáme větší množství různých formulací téže věty. Výsledný nástroj bude mít podobu webové aplikace, "online hry", kde uživatelé mezi sebou soutěží, kdo umí větu lépe nebo vícekrát říci jinak. Vzhledem k tomu, že budeme sbírat data od uživatelů, je nezbytnou součástí (vzájemná) validace získaných parafrází. Podstatou bakalářské práce je kromě samotné implementace webové aplikace zejména návrh takového "zadání" pro uživatele a takového postupu validací, aby "hra" byla atraktivní a generovala dostatečný počet parafrází v uspokojivé kvalitě. Zajištění skutečných uživatelů hry, a tedy přispěvatelů do sbírky parafrází není podmínkou splnění bakalářské práce. Pokud se však podaří uživatele oslovit a parafráze získat, bylo by velmi zajímavé srovnat např. varianty hry pro různé cílové skupiny uživatelů z hlediska počtu a kvality získaných parafrází. |
References |
Markus Dreyer, Daniel Marcu: HyTER: Meaning-Equivalent Semantics for Translation Evaluation. HLT-NAACL 2012: 162-171.
Bojar Ondřej. Čeština a strojový překlad. ÚFAL, Praha, Czechia, ISBN 978-80-904571-4-0, 168 pp. 2012. http://ufal.mff.cuni.cz/books_bojar_2012.html (sekce 8.4) |