Porovnáni metod česko-ruského automatického překladu
Název práce v češtině: | Porovnáni metod česko-ruského automatického překladu |
---|---|
Název v anglickém jazyce: | A Comparison of Methods of Czech-to-Russian Machine Translation |
Klíčová slova: | čeština, ruština, strojový překlad |
Klíčová slova anglicky: | Czech, Russian, Machine translation |
Akademický rok vypsání: | 2012/2013 |
Typ práce: | diplomová práce |
Jazyk práce: | angličtina |
Ústav: | Ústav formální a aplikované lingvistiky (32-UFAL) |
Vedoucí / školitel: | doc. RNDr. Vladislav Kuboň, Ph.D. |
Řešitel: | skrytý - zadáno a potvrzeno stud. odd. |
Datum přihlášení: | 15.11.2012 |
Datum zadání: | 22.11.2012 |
Datum potvrzení stud. oddělením: | 04.12.2012 |
Datum a čas obhajoby: | 08.09.2014 09:00 |
Datum odevzdání elektronické podoby: | 31.07.2014 |
Datum odevzdání tištěné podoby: | 31.07.2014 |
Datum proběhlé obhajoby: | 08.09.2014 |
Oponenti: | doc. RNDr. Ondřej Bojar, Ph.D. |
Konzultanti: | Mgr. Miroslav Týnovský |
Zásady pro vypracování |
Jazykový pár čeština a ruština je tradičním tématem výzkumu metod automatického překladu. Jedním z důvodů tohoto stavu je to, že se na tomto jazykovém páru dají dobře zkoumat výhody a nevýhody metod překladu mezi příbuznými jazyky. Existující překladové systémy, jak experimentální (RUSLAN, Česílko), tak i komerční (PC Translator), jsou založené na překladu pomocí ručně vytvářených pravidel. Cílem této diplomové práce je vyladit překladový systém založený na využití existujících paralelních dat (ať již statistickými metodami nebo pomocí strojového učení), porovnat jeho výstupy s existujícími systémy a pokusit se jeho kvalitu zlepšit přídavnými moduly (předzpracování nebo automatická revize), využívajícími příbuznost obou jazyků. Porovnání výstupů by kromě využití standardních metrik mělo identifikovat chyby typické pro jednotlivé přístupy a určit, které z nich bude možné dalším vývojem odstranit. |
Seznam odborné literatury |
Philipp Koehn & Hieu Hoang: Factored translation models. EMNLP-CoNLL-2007: Proceedings of the 2007 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning, June 28-30, 2007, Prague, Czech Republic; pp. 868-876
Karel Oliva. 1989. A parser for Czech implemented in Systems Q. Explizite Beschreibung der Sprache und automatische Textbearbeitung XVI, MFF UK, Prague, Czech Republic Hanna Béchara, Yanjun Ma, & Josef van Genabith: Statistical post-editing for a statistical MT system. MT Summit XIII: the Thirteenth Machine Translation Summit [organized by the] Asia-Pacific Association for Machine Translation (AAMT), 19-23 September 2011, Xiamen, China; pp.308-315 |