Možnosti zlepšení strojového překladu z angličtiny do češtiny
Název práce v češtině: | Možnosti zlepšení strojového překladu z angličtiny do češtiny |
---|---|
Název v anglickém jazyce: | Ways to Improve the Quality of English-Czech Machine Translation |
Akademický rok vypsání: | 2008/2009 |
Typ práce: | diplomová práce |
Jazyk práce: | angličtina |
Ústav: | Ústav formální a aplikované lingvistiky (32-UFAL) |
Vedoucí / školitel: | doc. Ing. Zdeněk Žabokrtský, Ph.D. |
Řešitel: | skrytý - zadáno a potvrzeno stud. odd. |
Datum přihlášení: | 04.11.2008 |
Datum zadání: | 04.11.2008 |
Datum a čas obhajoby: | 14.09.2009 00:00 |
Datum odevzdání elektronické podoby: | 14.09.2009 |
Datum proběhlé obhajoby: | 14.09.2009 |
Oponenti: | doc. RNDr. Ondřej Bojar, Ph.D. |
Zásady pro vypracování |
Student se podrobně seznámí se strojovým překladem z angličtiny
do češtiny implementovaným v systému TectoMT, případně i s dalšími existujícími překladovými systémy pro tento jazykový pár. Ve vzorku automaticky přeložených vět provede analýzu častých typů chyb a určí jejich příčiny. Pro vybrané typy chyb navrhne a implementuje postupy vedoucí k jejich alespoň částečnému odstranění. Dosažené zlepšení bude kvantitativně vyhodnoceno. |
Seznam odborné literatury |
[1] David Vilar, Jia Xu, Luis Fernando D'Haro, Hermann Ney:
Error Analysis of Statistical Machine Translation Output. In Proc. of the Fifth Int. Conf. on Language Resources and Evaluation (LREC), Italy, May. 2006. [2] Zdeněk Žabokrtský, Jan Ptáček, Petr Pajas: TectoMT: Highly Modular MT System with Tectogrammatics Used as Transfer Layer. In proc. of Workshop in Machine Translation, ACL'08. 2008. [3] Ondřej Bojar: Exploiting Linguistic Data in Machine Translation. PhD thesis, ÚFAL, MFF UK, Prague, Czech Republic, October 2008. |