Parafrázování českých vět pro vyhodnocování strojového překladu
Název práce v češtině: | |
---|---|
Název v anglickém jazyce: | Sentences Paraphrasing for Czech MT Evaluation |
Klíčová slova: | Parafrázování českých vět pro vyhodnocování strojového překladu |
Klíčová slova anglicky: | Sentences Paraphrasing for Czech MT Evaluation |
Akademický rok vypsání: | 2012/2013 |
Typ práce: | disertační práce |
Jazyk práce: | angličtina |
Ústav: | Ústav formální a aplikované lingvistiky (32-UFAL) |
Vedoucí / školitel: | doc. RNDr. Markéta Lopatková, Ph.D. |
Řešitel: | skrytý - zadáno a potvrzeno stud. odd. |
Datum přihlášení: | 26.09.2012 |
Datum zadání: | 26.09.2012 |
Datum potvrzení stud. oddělením: | 04.12.2012 |
Konzultanti: | doc. RNDr. Ondřej Bojar, Ph.D. |
Zásady pro vypracování |
Práce se zaměří na zkoumání možností parafrázování českých vět pro potřeby vyhodnocování strojového překladu. Jejím cílem je návrh a implementace systému, který pro českou větu z referenčního překladu vytvoří její parafráze blízké výstupu strojového překladu. Obohacení referenčního překladu o automaticky generované parafráze umožní spolehlivější vyhodnocování výstupů strojového překladu pomocí automatických metrik.
Předpokládá se využití existujících datových zdrojů (elektronické slovníky, ontologie, korpusy, treebanky) a dostupných nástrojů (např. morfologie, tagging, parsing, aligner; implementace jednotlivých metod strojového učení; výstupy strojového překladu). |
Seznam odborné literatury |
Kauchak, D., Barzilay, R.: Paraphrasing for Automatic Evaluation In Proceedings of the HLT Conference, NAACL, p. 455-462, New York, 2006. ACL
Madnani, Nitin and Bonnie J. Dorr, "Generating Phrasal and Sentential Paraphrases: A Survey of Data-Driven Methods", Computational Linguistics, 36:3, pp. 341--387, 2010 Madnani, Nitin and Bonnie J. Dorr, "Generating Targeted Paraphrases for Improved Translation." Transactions on Intelligent Systems and Technology, 2011. Owczarzak, Karolina and Groves, Declan and van Genabith, Josef and Way, Andy (2006) Contextual bitext-derived paraphrases in automatic MT evaluation. In HLT-NAACL 2006 Workshop on Statistical Machine Translation, 8-9 June 2006, New York, NY, USA. Zhou, L., Lin, C. Y., Munteanu, D. S. and Hovy, E. (2006). ParaEval Using Paraphrases to Evaluate Summaries Automatically. Proc. 2006 Human Language Technology Conference of the North American Chapter of the Association for Computational Linguistics, pp. 447-454. |
Předběžná náplň práce |
Práce se zaměří na zkoumání možností parafrázování českých vět pro potřeby vyhodnocování strojového překladu. Jejím cílem je návrh a implementace systému, který pro českou větu z referenčního překladu vytvoří její parafráze blízké výstupu strojového překladu. Obohacení referenčního překladu o automaticky generované parafráze umožní spolehlivější vyhodnocování výstupů strojového překladu pomocí automatických metrik. |