Pravděpodobnostní překladový slovník
Název práce v češtině: | Pravděpodobnostní překladový slovník |
---|---|
Název v anglickém jazyce: | Probabilistic Translation Dictionary |
Akademický rok vypsání: | 2007/2008 |
Typ práce: | diplomová práce |
Jazyk práce: | angličtina |
Ústav: | Ústav formální a aplikované lingvistiky (32-UFAL) |
Vedoucí / školitel: | doc. Ing. Zdeněk Žabokrtský, Ph.D. |
Řešitel: | skrytý - zadáno a potvrzeno stud. odd. |
Datum přihlášení: | 28.11.2007 |
Datum zadání: | 28.11.2007 |
Datum a čas obhajoby: | 14.09.2009 00:00 |
Datum odevzdání elektronické podoby: | 14.09.2009 |
Datum proběhlé obhajoby: | 14.09.2009 |
Oponenti: | doc. RNDr. Pavel Pecina, Ph.D. |
Zásady pro vypracování |
Student se podrobně seznámí s datovými zdroji využitelnými pro
úlohu strojového překladu pro pár angličtina-čeština (mj. paralelní korpusy [1] a [2]). Navrhne a implementuje postup pro automatické rozšíření existujícího slovníku popsaného v [3], a to co do množství překladových hesel i bohatosti statistické informace. Zlepšení v pokrytí slovníku vyhodnotí na korpusových datech. V jazyku Perl implementuje pro vzniklý slovník aplikační rozhraní vhodné pro potřeby strojového překladu. |
Seznam odborné literatury |
[1] Jan Cuřín, et al. Prague Czech-English Dependency Treebank 1.0.
Linguistic Data Consortium, Philadelphia, 2004. [2] Bojar, O; Žabokrtský, Z.: CzEng: Czech-English Parallel Corpus, Release version 0.5. PBML 86 (Prague Bulletin of Mathematical Linguistics), 2006. [3] Jan Cuřín: Statistical Methods in Czech-English Machine Translation. PhD Thesis. Charles University, Faculty of Mathematics and Physics, 2006. |