Automatické hodnocení kvality paralelních dvojjazyčných dat
Název práce v češtině: | Automatické hodnocení kvality paralelních dvojjazyčných dat |
---|---|
Název v anglickém jazyce: | Automatic Evaluation of Parallel Bilingual Data Quality |
Akademický rok vypsání: | 2005/2006 |
Typ práce: | diplomová práce |
Jazyk práce: | čeština |
Ústav: | Ústav formální a aplikované lingvistiky (32-UFAL) |
Vedoucí / školitel: | doc. RNDr. Vladislav Kuboň, Ph.D. |
Řešitel: | skrytý - zadáno a potvrzeno stud. odd. |
Datum přihlášení: | 14.11.2005 |
Datum zadání: | 14.11.2005 |
Datum potvrzení stud. oddělením: | 29.04.2013 |
Datum a čas obhajoby: | 11.09.2006 00:00 |
Datum proběhlé obhajoby: | 11.09.2006 |
Oponenti: | RNDr. Martin Čmejrek, Ph.D. |
Zásady pro vypracování |
Náplní práce bude návrh a implementace metody, která by umožnila klasifikovat dvojjazyčná textová data z hlediska ekvivalence překladu. Metoda by měla být schopna oddělit data, kde se jedná o překlad více méně doslovný, a tedy vhodný jako trénovací data pro stochastické systémy automatického překladu, a data, která vznikla jako volný překlad a k podobnému účelu se nehodí.
Práce by měla obsahovat vyhodnocení souvislosti mezi názorem lidského překladatele a výsledkem automatického hodnocení. Kromě toho by také bylo vhodné ověřit na nějakém stochastickém překladovém systému hypotézu, zda se kvalita paralelních dvojjazyčných dat skutečně projeví na kvalitě výstupu. |
Seznam odborné literatury |
Anders Klevbacke: Parallel Text Alignment Algorithms. Chalmers University of Technology, 2001
Michael Schiehlen: Learning Tense Translation from Bilingual Corpora. University of Stuttgart, 1998 Jorge Civera, Elsa Cubel, Alfons Juan, and Enrique Vidal: Different Approaches to Bilingual Text Classification Based on Grammatical Inference Techniques. Universidad Politecnica de Valencia, 2003 |