Thesis (Selection of subject)Thesis (Selection of subject)(version: 368)
Thesis details
   Login via CAS
Optimalizace frázového překladu na rychlost
Thesis title in Czech: Optimalizace frázového překladu na rychlost
Thesis title in English: Speeding-up Phrase-Based Machine Translation
Academic year of topic announcement: 2014/2015
Thesis type: school year task
Thesis language:
Department: Institute of Formal and Applied Linguistics (32-UFAL)
Supervisor: doc. RNDr. Ondřej Bojar, Ph.D.
Author:
Guidelines
Frázový překlad v současné době dominuje volně dostupným nástrojům pro strojový překlad co do kvality výstupu (konkrétně se jedná zejména o systém Moses). Většina experimentů se přirozeně soustředí na další zlepšování srozumitelnosti výstupu. Neméně zajímavá otázka je však, nakolik je možné existující implementace zrychlit při zachování stejné kvality výstupu.

Úkolem ročníkového projektu a navazující bakalářské práce je pro anglicko-český překlad provést sérii experimentů a podle potřeby implementovat např. nástroje pro filtraci vstupních dat (tj. slovníků překladů frází) s cílem překlad zrychlit. Nedílnou součástí bakalářské práce je kontrola, zda zrychlený systém opravdu zachovává kvalitu překladu i při hodnocení ručním, nikoli jen podle automatických metrik.

Jako rozšíření práce je možné uvažovat i o profilingu a vylepšení samotného jádra překladového systému Moses.
References
Philipp Koehn, Hieu Hoang, Alexandra Birch, Chris Callison-Burch, Marcello Federico, Nicola Bertoldi, Brooke Cowan, Wade Shen, Christine Moran, Richard Zens, Chris Dyer, Ondrej Bojar, Alexandra Constantin, Evan Herbst, Moses: Open Source Toolkit for Statistical Machine Translation, Annual Meeting of the Association for Computational Linguistics (ACL), demonstration session, Prague, Czech Republic, June 2007.
http://www.statmt.org/moses/

Ondřej Bojar, Miroslav Janíček, Zdeněk Žabokrtský, Pavel Češka, and Peter Beňa. CzEng 0.7: Parallel Corpus with Community-Supplied Translations. In Proceedings of the Sixth International Language Resources and Evaluation (LREC'08), Marrakech, Morocco, May 2008. ELRA.
http://ufal.mff.cuni.cz/czeng/

Bojar Ondřej. Čeština a strojový překlad. ÚFAL, Praha, Czechia, ISBN 978-80-904571-4-0, 168 pp. 2012.
http://ufal.mff.cuni.cz/books_bojar_2012.html
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html