Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Dynamické parametrizování statistického strojového překladu
Název práce v češtině: Dynamické parametrizování statistického strojového překladu
Název v anglickém jazyce: Dynamic parametrization of statistical machine translation
Klíčová slova: statistický strojový překlad, optimalizace parametrů
Klíčová slova anglicky: statistical machine translation, parameter otpimization
Akademický rok vypsání: 2014/2015
Typ práce: diplomová práce
Jazyk práce:
Ústav: Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel: doc. RNDr. Pavel Pecina, Ph.D.
Řešitel:
Zásady pro vypracování
Moderní systémy pro statistický strojový překlad jsou založeny na tzv. log-lineárním modelu, který se používá pro hodnocení jednotlivých překladových hypotéz v průběhu tzv. dekódování, hledání nejlepšího překladu vstupní věty. Tento model spočívá v lineární kombinaci zlogaritmovaných hodnot poskytovaných dílčími modely (překladové modely, jazykový model, atd.), která je parametrizovaná tzv. váhovým vektorem. Každý dílčí model má tedy přiřazenu svoji váhu. Optimalizace váhového vektoru se provádí na tzv. vývojových datech, nejčastěji metodou Minimum Error Weight Training, a má podstatný vliv na kvalitu výsledného překladu. Doposud se předpokládalo, že nastavení váhového vektoru je pro konkrétní úlohu pevné, ale nabízí se otázka, zda-li by nebylo výhodnější váhový vektor nastavit pro každou překládanou větu zvlášť.

Diplomové práce má dva cíle: 1) implementace dynamického parametrizování log-lineárního modelu do překladového systému Moses a 2) navržení, implementace a otestování funkce, která by změnu váhového vektoru prováděla pro každou větu zvlášť.
Seznam odborné literatury
Philipp Koehn. Statistical Machine Translation. Cambridge University Press, 2010. ISBN 978-0521874151.

Philipp Koehn, Hieu Hoang. Factored Translation Models. Proceedings of the 2007 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning. Prague, Czech Republic. 2007.

Pavel Pecina, Antonio Toral, Vassilis Papavassiliou, Prokopis Prokopidis, and Josef van Genabith. Domain Adaptation of Statistical Machine Translation using Web-Crawled Resources: A Case Study. In EAMT 2012: Proceedings of the 16th Annual Conference of the European Association for Machine Translation, Trento, Italy, pp. 145-152, 2012.
 
Univerzita Karlova | Informační systém UK