Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Automatic Alignment of Tectogrammatical Trees from Czech-English Parallel Corpus
Název práce v češtině: Automatické párování tektogramatických stromů z
česko-anglického paralelního korpusu
Název v anglickém jazyce: Automatic Alignment of Tectogrammatical Trees from Czech-English Parallel Corpus
Akademický rok vypsání: 2007/2008
Typ práce: diplomová práce
Jazyk práce: angličtina
Ústav: Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel: doc. Ing. Zdeněk Žabokrtský, Ph.D.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 18.10.2007
Datum zadání: 18.10.2007
Datum a čas obhajoby: 08.09.2008 00:00
Datum odevzdání elektronické podoby:08.09.2008
Datum proběhlé obhajoby: 08.09.2008
Oponenti: doc. RNDr. Ondřej Bojar, Ph.D.
 
 
 
Zásady pro vypracování
Student se seznámí s anotačním schématem Pražského závislostního korpusu, zejména
s jeho tektogramatickou rovinou. Navrhne a implementuje automatický systém, který
pro sobě odpovídající vstupní český a anglický tektogramatický strom navrhne seznam
korespondencí mezi tektogramatickými uzly.
Seznam odborné literatury
Dokumentace k PDT 2.0, viz http://ufal.mff.cuni.cz/pdt/

Mary Hearne, John Tinsley, Ventislav Zhenchev, Andy Way: Capturing Translational Divergences
with a Statistical Tree-to-tree Aligner. In: Proceedings of the 11th International
Conference on Theoretical and Methodological Issues in Machine Translation, Sweden, 2007

Arul Menezes, Stephen D. Richardson: A best-first alignment algorithm for automatic
extraction of transfer mappings from bilingual corpora. Proceedings of the Workshop
on Data-driven Machine Translation, 39, 2001.

Bojar, O; Žabokrtský, Z.: CzEng: Czech-English Parallel Corpus, Release version 0.5.
PBML 86 (Prague Bulletin of Mathematical Linguistics), 2006.
 
Univerzita Karlova | Informační systém UK