Porovnáni metod česko-ruského automatického překladu
Thesis title in Czech: | Porovnáni metod česko-ruského automatického překladu |
---|---|
Thesis title in English: | A Comparison of Methods of Czech-to-Russian Machine Translation |
Key words: | čeština, ruština, strojový překlad |
English key words: | Czech, Russian, Machine translation |
Academic year of topic announcement: | 2012/2013 |
Thesis type: | diploma thesis |
Thesis language: | angličtina |
Department: | Institute of Formal and Applied Linguistics (32-UFAL) |
Supervisor: | doc. RNDr. Vladislav Kuboň, Ph.D. |
Author: | hidden - assigned and confirmed by the Study Dept. |
Date of registration: | 15.11.2012 |
Date of assignment: | 22.11.2012 |
Confirmed by Study dept. on: | 04.12.2012 |
Date and time of defence: | 08.09.2014 09:00 |
Date of electronic submission: | 31.07.2014 |
Date of submission of printed version: | 31.07.2014 |
Date of proceeded defence: | 08.09.2014 |
Opponents: | doc. RNDr. Ondřej Bojar, Ph.D. |
Advisors: | Mgr. Miroslav Týnovský |
Guidelines |
Jazykový pár čeština a ruština je tradičním tématem výzkumu metod automatického překladu. Jedním z důvodů tohoto stavu je to, že se na tomto jazykovém páru dají dobře zkoumat výhody a nevýhody metod překladu mezi příbuznými jazyky. Existující překladové systémy, jak experimentální (RUSLAN, Česílko), tak i komerční (PC Translator), jsou založené na překladu pomocí ručně vytvářených pravidel. Cílem této diplomové práce je vyladit překladový systém založený na využití existujících paralelních dat (ať již statistickými metodami nebo pomocí strojového učení), porovnat jeho výstupy s existujícími systémy a pokusit se jeho kvalitu zlepšit přídavnými moduly (předzpracování nebo automatická revize), využívajícími příbuznost obou jazyků. Porovnání výstupů by kromě využití standardních metrik mělo identifikovat chyby typické pro jednotlivé přístupy a určit, které z nich bude možné dalším vývojem odstranit. |
References |
Philipp Koehn & Hieu Hoang: Factored translation models. EMNLP-CoNLL-2007: Proceedings of the 2007 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning, June 28-30, 2007, Prague, Czech Republic; pp. 868-876
Karel Oliva. 1989. A parser for Czech implemented in Systems Q. Explizite Beschreibung der Sprache und automatische Textbearbeitung XVI, MFF UK, Prague, Czech Republic Hanna Béchara, Yanjun Ma, & Josef van Genabith: Statistical post-editing for a statistical MT system. MT Summit XIII: the Thirteenth Machine Translation Summit [organized by the] Asia-Pacific Association for Machine Translation (AAMT), 19-23 September 2011, Xiamen, China; pp.308-315 |