Dynamické parametrizování statistického strojového překladu
Thesis title in Czech: | Dynamické parametrizování statistického strojového překladu |
---|---|
Thesis title in English: | Dynamic parametrization of statistical machine translation |
Key words: | statistický strojový překlad, optimalizace parametrů |
English key words: | statistical machine translation, parameter otpimization |
Academic year of topic announcement: | 2014/2015 |
Thesis type: | diploma thesis |
Thesis language: | |
Department: | Institute of Formal and Applied Linguistics (32-UFAL) |
Supervisor: | doc. RNDr. Pavel Pecina, Ph.D. |
Author: |
Guidelines |
Moderní systémy pro statistický strojový překlad jsou založeny na tzv. log-lineárním modelu, který se používá pro hodnocení jednotlivých překladových hypotéz v průběhu tzv. dekódování, hledání nejlepšího překladu vstupní věty. Tento model spočívá v lineární kombinaci zlogaritmovaných hodnot poskytovaných dílčími modely (překladové modely, jazykový model, atd.), která je parametrizovaná tzv. váhovým vektorem. Každý dílčí model má tedy přiřazenu svoji váhu. Optimalizace váhového vektoru se provádí na tzv. vývojových datech, nejčastěji metodou Minimum Error Weight Training, a má podstatný vliv na kvalitu výsledného překladu. Doposud se předpokládalo, že nastavení váhového vektoru je pro konkrétní úlohu pevné, ale nabízí se otázka, zda-li by nebylo výhodnější váhový vektor nastavit pro každou překládanou větu zvlášť.
Diplomové práce má dva cíle: 1) implementace dynamického parametrizování log-lineárního modelu do překladového systému Moses a 2) navržení, implementace a otestování funkce, která by změnu váhového vektoru prováděla pro každou větu zvlášť. |
References |
Philipp Koehn. Statistical Machine Translation. Cambridge University Press, 2010. ISBN 978-0521874151.
Philipp Koehn, Hieu Hoang. Factored Translation Models. Proceedings of the 2007 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning. Prague, Czech Republic. 2007. Pavel Pecina, Antonio Toral, Vassilis Papavassiliou, Prokopis Prokopidis, and Josef van Genabith. Domain Adaptation of Statistical Machine Translation using Web-Crawled Resources: A Case Study. In EAMT 2012: Proceedings of the 16th Annual Conference of the European Association for Machine Translation, Trento, Italy, pp. 145-152, 2012. |