Parafrázování českých vět pro vyhodnocování strojového překladu
Thesis title in Czech: | |
---|---|
Thesis title in English: | Sentences Paraphrasing for Czech MT Evaluation |
Key words: | Parafrázování českých vět pro vyhodnocování strojového překladu |
English key words: | Sentences Paraphrasing for Czech MT Evaluation |
Academic year of topic announcement: | 2012/2013 |
Thesis type: | dissertation |
Thesis language: | angličtina |
Department: | Institute of Formal and Applied Linguistics (32-UFAL) |
Supervisor: | doc. RNDr. Markéta Lopatková, Ph.D. |
Author: | hidden - assigned and confirmed by the Study Dept. |
Date of registration: | 26.09.2012 |
Date of assignment: | 26.09.2012 |
Confirmed by Study dept. on: | 04.12.2012 |
Advisors: | doc. RNDr. Ondřej Bojar, Ph.D. |
Guidelines |
Práce se zaměří na zkoumání možností parafrázování českých vět pro potřeby vyhodnocování strojového překladu. Jejím cílem je návrh a implementace systému, který pro českou větu z referenčního překladu vytvoří její parafráze blízké výstupu strojového překladu. Obohacení referenčního překladu o automaticky generované parafráze umožní spolehlivější vyhodnocování výstupů strojového překladu pomocí automatických metrik.
Předpokládá se využití existujících datových zdrojů (elektronické slovníky, ontologie, korpusy, treebanky) a dostupných nástrojů (např. morfologie, tagging, parsing, aligner; implementace jednotlivých metod strojového učení; výstupy strojového překladu). |
References |
Kauchak, D., Barzilay, R.: Paraphrasing for Automatic Evaluation In Proceedings of the HLT Conference, NAACL, p. 455-462, New York, 2006. ACL
Madnani, Nitin and Bonnie J. Dorr, "Generating Phrasal and Sentential Paraphrases: A Survey of Data-Driven Methods", Computational Linguistics, 36:3, pp. 341--387, 2010 Madnani, Nitin and Bonnie J. Dorr, "Generating Targeted Paraphrases for Improved Translation." Transactions on Intelligent Systems and Technology, 2011. Owczarzak, Karolina and Groves, Declan and van Genabith, Josef and Way, Andy (2006) Contextual bitext-derived paraphrases in automatic MT evaluation. In HLT-NAACL 2006 Workshop on Statistical Machine Translation, 8-9 June 2006, New York, NY, USA. Zhou, L., Lin, C. Y., Munteanu, D. S. and Hovy, E. (2006). ParaEval Using Paraphrases to Evaluate Summaries Automatically. Proc. 2006 Human Language Technology Conference of the North American Chapter of the Association for Computational Linguistics, pp. 447-454. |
Preliminary scope of work |
Práce se zaměří na zkoumání možností parafrázování českých vět pro potřeby vyhodnocování strojového překladu. Jejím cílem je návrh a implementace systému, který pro českou větu z referenčního překladu vytvoří její parafráze blízké výstupu strojového překladu. Obohacení referenčního překladu o automaticky generované parafráze umožní spolehlivější vyhodnocování výstupů strojového překladu pomocí automatických metrik. |