Thesis (Selection of subject)Thesis (Selection of subject)(version: 368)
Thesis details
   Login via CAS
Dynamické parametrizování statistického strojového překladu
Thesis title in Czech: Dynamické parametrizování statistického strojového překladu
Thesis title in English: Dynamic parametrization of statistical machine translation
Key words: statistický strojový překlad, optimalizace parametrů
English key words: statistical machine translation, parameter otpimization
Academic year of topic announcement: 2014/2015
Thesis type: diploma thesis
Thesis language:
Department: Institute of Formal and Applied Linguistics (32-UFAL)
Supervisor: doc. RNDr. Pavel Pecina, Ph.D.
Author:
Guidelines
Moderní systémy pro statistický strojový překlad jsou založeny na tzv. log-lineárním modelu, který se používá pro hodnocení jednotlivých překladových hypotéz v průběhu tzv. dekódování, hledání nejlepšího překladu vstupní věty. Tento model spočívá v lineární kombinaci zlogaritmovaných hodnot poskytovaných dílčími modely (překladové modely, jazykový model, atd.), která je parametrizovaná tzv. váhovým vektorem. Každý dílčí model má tedy přiřazenu svoji váhu. Optimalizace váhového vektoru se provádí na tzv. vývojových datech, nejčastěji metodou Minimum Error Weight Training, a má podstatný vliv na kvalitu výsledného překladu. Doposud se předpokládalo, že nastavení váhového vektoru je pro konkrétní úlohu pevné, ale nabízí se otázka, zda-li by nebylo výhodnější váhový vektor nastavit pro každou překládanou větu zvlášť.

Diplomové práce má dva cíle: 1) implementace dynamického parametrizování log-lineárního modelu do překladového systému Moses a 2) navržení, implementace a otestování funkce, která by změnu váhového vektoru prováděla pro každou větu zvlášť.
References
Philipp Koehn. Statistical Machine Translation. Cambridge University Press, 2010. ISBN 978-0521874151.

Philipp Koehn, Hieu Hoang. Factored Translation Models. Proceedings of the 2007 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning. Prague, Czech Republic. 2007.

Pavel Pecina, Antonio Toral, Vassilis Papavassiliou, Prokopis Prokopidis, and Josef van Genabith. Domain Adaptation of Statistical Machine Translation using Web-Crawled Resources: A Case Study. In EAMT 2012: Proceedings of the 16th Annual Conference of the European Association for Machine Translation, Trento, Italy, pp. 145-152, 2012.
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html