Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Porovnáni metod česko-ruského automatického překladu
Název práce v češtině: Porovnáni metod česko-ruského automatického překladu
Název v anglickém jazyce: A Comparison of Methods of Czech-to-Russian Machine Translation
Klíčová slova: čeština, ruština, strojový překlad
Klíčová slova anglicky: Czech, Russian, Machine translation
Akademický rok vypsání: 2012/2013
Typ práce: diplomová práce
Jazyk práce: angličtina
Ústav: Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel: doc. RNDr. Vladislav Kuboň, Ph.D.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 15.11.2012
Datum zadání: 22.11.2012
Datum potvrzení stud. oddělením: 04.12.2012
Datum a čas obhajoby: 08.09.2014 09:00
Datum odevzdání elektronické podoby:31.07.2014
Datum odevzdání tištěné podoby:31.07.2014
Datum proběhlé obhajoby: 08.09.2014
Oponenti: doc. RNDr. Ondřej Bojar, Ph.D.
 
 
 
Konzultanti: Mgr. Miroslav Týnovský
Zásady pro vypracování
Jazykový pár čeština a ruština je tradičním tématem výzkumu metod automatického překladu. Jedním z důvodů tohoto stavu je to, že se na tomto jazykovém páru dají dobře zkoumat výhody a nevýhody metod překladu mezi příbuznými jazyky. Existující překladové systémy, jak experimentální (RUSLAN, Česílko), tak i komerční (PC Translator), jsou založené na překladu pomocí ručně vytvářených pravidel. Cílem této diplomové práce je vyladit překladový systém založený na využití existujících paralelních dat (ať již statistickými metodami nebo pomocí strojového učení), porovnat jeho výstupy s existujícími systémy a pokusit se jeho kvalitu zlepšit přídavnými moduly (předzpracování nebo automatická revize), využívajícími příbuznost obou jazyků. Porovnání výstupů by kromě využití standardních metrik mělo identifikovat chyby typické pro jednotlivé přístupy a určit, které z nich bude možné dalším vývojem odstranit.
Seznam odborné literatury
Philipp Koehn & Hieu Hoang: Factored translation models. EMNLP-CoNLL-2007: Proceedings of the 2007 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning, June 28-30, 2007, Prague, Czech Republic; pp. 868-876

Karel Oliva. 1989. A parser for Czech implemented in Systems Q. Explizite Beschreibung der Sprache und automatische Textbearbeitung XVI, MFF UK, Prague, Czech Republic

Hanna Béchara, Yanjun Ma, & Josef van Genabith: Statistical post-editing for a statistical MT system. MT Summit XIII: the Thirteenth Machine Translation Summit [organized by the] Asia-Pacific Association for Machine Translation (AAMT), 19-23 September 2011, Xiamen, China; pp.308-315
 
Univerzita Karlova | Informační systém UK