Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 390)
Detail práce
   Přihlásit přes CAS
Doménová závislost překladových slovníků
Název práce v češtině: Doménová závislost překladových slovníků
Název v anglickém jazyce: Domain (In)Dependence of Phrase Translations
Akademický rok vypsání: 2010/2011
Typ práce: ročníková práce
Jazyk práce:
Ústav: Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel: doc. RNDr. Ondřej Bojar, Ph.D.
Řešitel:
Zásady pro vypracování
Cílem ročníkového projektu a navazující bakalářské práce je rozšířit existující nástroje pro extrakci slovníků překladů frází o automatickou identifikaci doménové závislosti dané fráze.

Lze se domnívat, že fráze, které se vyskytnou v mnoha typech textů jsou univerzálnější, a proto důležitější pro obecný překlad bez ohledu na doménu. Velmi specifické fráze naproti tomu přinášejí potřebnou lexikální zásobu pro danou doménu.

Cílem práce je tuto hypotézu experimentálně prověřit. V rámci ročníkového projektu půjde zejména o návrh a implementaci nějaké míry univerzálnosti dané fráze podle výskytů v různých zdrojových textech a implementaci nástroje, který tuto míru nad danými korpusy změří. V rámci bakalářské práce pak bude tato míra nějakým způsobem explicitně použita v experimentech se strojovým překladem.

Téma je vhodné i pro (navazující) diplomovou práci.
Seznam odborné literatury
Philipp Koehn, Hieu Hoang, Alexandra Birch, Chris Callison-Burch, Marcello Federico, Nicola Bertoldi, Brooke Cowan, Wade Shen, Christine Moran, Richard Zens, Chris Dyer, Ondrej Bojar, Alexandra Constantin, Evan Herbst, Moses: Open Source Toolkit for Statistical Machine Translation, Annual Meeting of the Association for Computational Linguistics (ACL), demonstration session, Prague, Czech Republic, June 2007.
http://www.statmt.org/moses/

Ondřej Bojar, Miroslav Janíček, Zdeněk Žabokrtský, Pavel Češka, and Peter Beňa. CzEng 0.7: Parallel Corpus with Community-Supplied Translations. In Proceedings of the Sixth International Language Resources and Evaluation (LREC'08), Marrakech, Morocco, May 2008. ELRA.
http://ufal.mff.cuni.cz/czeng/
 
Univerzita Karlova | Informační systém UK