Automatic Alignment of Tectogrammatical Trees from Czech-English Parallel Corpus
Název práce v češtině: | Automatické párování tektogramatických stromů z česko-anglického paralelního korpusu |
---|---|
Název v anglickém jazyce: | Automatic Alignment of Tectogrammatical Trees from Czech-English Parallel Corpus |
Akademický rok vypsání: | 2007/2008 |
Typ práce: | diplomová práce |
Jazyk práce: | angličtina |
Ústav: | Ústav formální a aplikované lingvistiky (32-UFAL) |
Vedoucí / školitel: | doc. Ing. Zdeněk Žabokrtský, Ph.D. |
Řešitel: | skrytý - zadáno a potvrzeno stud. odd. |
Datum přihlášení: | 18.10.2007 |
Datum zadání: | 18.10.2007 |
Datum a čas obhajoby: | 08.09.2008 00:00 |
Datum odevzdání elektronické podoby: | 08.09.2008 |
Datum proběhlé obhajoby: | 08.09.2008 |
Oponenti: | doc. RNDr. Ondřej Bojar, Ph.D. |
Zásady pro vypracování |
Student se seznámí s anotačním schématem Pražského závislostního korpusu, zejména
s jeho tektogramatickou rovinou. Navrhne a implementuje automatický systém, který pro sobě odpovídající vstupní český a anglický tektogramatický strom navrhne seznam korespondencí mezi tektogramatickými uzly. |
Seznam odborné literatury |
Dokumentace k PDT 2.0, viz http://ufal.mff.cuni.cz/pdt/
Mary Hearne, John Tinsley, Ventislav Zhenchev, Andy Way: Capturing Translational Divergences with a Statistical Tree-to-tree Aligner. In: Proceedings of the 11th International Conference on Theoretical and Methodological Issues in Machine Translation, Sweden, 2007 Arul Menezes, Stephen D. Richardson: A best-first alignment algorithm for automatic extraction of transfer mappings from bilingual corpora. Proceedings of the Workshop on Data-driven Machine Translation, 39, 2001. Bojar, O; Žabokrtský, Z.: CzEng: Czech-English Parallel Corpus, Release version 0.5. PBML 86 (Prague Bulletin of Mathematical Linguistics), 2006. |