Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Optimalizace frázového překladu na rychlost
Název práce v češtině: Optimalizace frázového překladu na rychlost
Název v anglickém jazyce: Speeding-up Phrase-Based Machine Translation
Akademický rok vypsání: 2014/2015
Typ práce: ročníková práce
Jazyk práce:
Ústav: Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel: doc. RNDr. Ondřej Bojar, Ph.D.
Řešitel:
Zásady pro vypracování
Frázový překlad v současné době dominuje volně dostupným nástrojům pro strojový překlad co do kvality výstupu (konkrétně se jedná zejména o systém Moses). Většina experimentů se přirozeně soustředí na další zlepšování srozumitelnosti výstupu. Neméně zajímavá otázka je však, nakolik je možné existující implementace zrychlit při zachování stejné kvality výstupu.

Úkolem ročníkového projektu a navazující bakalářské práce je pro anglicko-český překlad provést sérii experimentů a podle potřeby implementovat např. nástroje pro filtraci vstupních dat (tj. slovníků překladů frází) s cílem překlad zrychlit. Nedílnou součástí bakalářské práce je kontrola, zda zrychlený systém opravdu zachovává kvalitu překladu i při hodnocení ručním, nikoli jen podle automatických metrik.

Jako rozšíření práce je možné uvažovat i o profilingu a vylepšení samotného jádra překladového systému Moses.
Seznam odborné literatury
Philipp Koehn, Hieu Hoang, Alexandra Birch, Chris Callison-Burch, Marcello Federico, Nicola Bertoldi, Brooke Cowan, Wade Shen, Christine Moran, Richard Zens, Chris Dyer, Ondrej Bojar, Alexandra Constantin, Evan Herbst, Moses: Open Source Toolkit for Statistical Machine Translation, Annual Meeting of the Association for Computational Linguistics (ACL), demonstration session, Prague, Czech Republic, June 2007.
http://www.statmt.org/moses/

Ondřej Bojar, Miroslav Janíček, Zdeněk Žabokrtský, Pavel Češka, and Peter Beňa. CzEng 0.7: Parallel Corpus with Community-Supplied Translations. In Proceedings of the Sixth International Language Resources and Evaluation (LREC'08), Marrakech, Morocco, May 2008. ELRA.
http://ufal.mff.cuni.cz/czeng/

Bojar Ondřej. Čeština a strojový překlad. ÚFAL, Praha, Czechia, ISBN 978-80-904571-4-0, 168 pp. 2012.
http://ufal.mff.cuni.cz/books_bojar_2012.html
 
Univerzita Karlova | Informační systém UK