Thesis (Selection of subject)

Your browser does not support JavaScript, or its support is disabled. Some features may not be available.

Porovnáni metod česko-ruského automatického překladu

Thesis title in Czech:	Porovnáni metod česko-ruského automatického překladu
Thesis title in English:	A Comparison of Methods of Czech-to-Russian Machine Translation
Key words:	čeština, ruština, strojový překlad
English key words:	Czech, Russian, Machine translation
Academic year of topic announcement:	2012/2013
Thesis type:	diploma thesis
Thesis language:	angličtina
Department:	Institute of Formal and Applied Linguistics (32-UFAL)
Supervisor:	doc. RNDr. Vladislav Kuboň, Ph.D.
Author:	hidden - assigned and confirmed by the Study Dept.
Date of registration:	15.11.2012
Date of assignment:	22.11.2012
Confirmed by Study dept. on:	04.12.2012
Date and time of defence:	08.09.2014 09:00
Date of electronic submission:	31.07.2014
Date of submission of printed version:	31.07.2014
Date of proceeded defence:	08.09.2014
Opponents:	doc. RNDr. Ondřej Bojar, Ph.D.



Advisors:	Mgr. Miroslav Týnovský

Guidelines

Jazykový pár čeština a ruština je tradičním tématem výzkumu metod automatického překladu. Jedním z důvodů tohoto stavu je to, že se na tomto jazykovém páru dají dobře zkoumat výhody a nevýhody metod překladu mezi příbuznými jazyky. Existující překladové systémy, jak experimentální (RUSLAN, Česílko), tak i komerční (PC Translator), jsou založené na překladu pomocí ručně vytvářených pravidel. Cílem této diplomové práce je vyladit překladový systém založený na využití existujících paralelních dat (ať již statistickými metodami nebo pomocí strojového učení), porovnat jeho výstupy s existujícími systémy a pokusit se jeho kvalitu zlepšit přídavnými moduly (předzpracování nebo automatická revize), využívajícími příbuznost obou jazyků. Porovnání výstupů by kromě využití standardních metrik mělo identifikovat chyby typické pro jednotlivé přístupy a určit, které z nich bude možné dalším vývojem odstranit.

References

Philipp Koehn & Hieu Hoang: Factored translation models. EMNLP-CoNLL-2007: Proceedings of the 2007 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning, June 28-30, 2007, Prague, Czech Republic; pp. 868-876

Karel Oliva. 1989. A parser for Czech implemented in Systems Q. Explizite Beschreibung der Sprache und automatische Textbearbeitung XVI, MFF UK, Prague, Czech Republic

Hanna Béchara, Yanjun Ma, & Josef van Genabith: Statistical post-editing for a statistical MT system. MT Summit XIII: the Thirteenth Machine Translation Summit [organized by the] Asia-Pacific Association for Machine Translation (AAMT), 19-23 September 2011, Xiamen, China; pp.308-315