Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Pravděpodobnostní překladový slovník
Název práce v češtině: Pravděpodobnostní překladový slovník
Název v anglickém jazyce: Probabilistic Translation Dictionary
Akademický rok vypsání: 2007/2008
Typ práce: diplomová práce
Jazyk práce: angličtina
Ústav: Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel: doc. Ing. Zdeněk Žabokrtský, Ph.D.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 28.11.2007
Datum zadání: 28.11.2007
Datum a čas obhajoby: 14.09.2009 00:00
Datum odevzdání elektronické podoby:14.09.2009
Datum proběhlé obhajoby: 14.09.2009
Oponenti: doc. RNDr. Pavel Pecina, Ph.D.
 
 
 
Zásady pro vypracování
Student se podrobně seznámí s datovými zdroji využitelnými pro
úlohu strojového překladu pro pár angličtina-čeština
(mj. paralelní korpusy [1] a [2]). Navrhne a implementuje postup
pro automatické rozšíření existujícího slovníku popsaného v [3],
a to co do množství překladových hesel i bohatosti statistické informace.
Zlepšení v pokrytí slovníku vyhodnotí na korpusových datech.
V jazyku Perl implementuje pro vzniklý slovník aplikační rozhraní
vhodné pro potřeby strojového překladu.
Seznam odborné literatury
[1] Jan Cuřín, et al. Prague Czech-English Dependency Treebank 1.0.
Linguistic Data Consortium, Philadelphia, 2004.

[2] Bojar, O; Žabokrtský, Z.: CzEng: Czech-English Parallel Corpus, Release version 0.5.
PBML 86 (Prague Bulletin of Mathematical Linguistics), 2006.

[3] Jan Cuřín: Statistical Methods in Czech-English Machine Translation.
PhD Thesis. Charles University, Faculty of Mathematics and Physics, 2006.
 
Univerzita Karlova | Informační systém UK