Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Automatické hodnocení kvality paralelních dvojjazyčných dat
Název práce v češtině: Automatické hodnocení kvality paralelních dvojjazyčných dat
Název v anglickém jazyce: Automatic Evaluation of Parallel Bilingual Data Quality
Akademický rok vypsání: 2005/2006
Typ práce: diplomová práce
Jazyk práce: čeština
Ústav: Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel: doc. RNDr. Vladislav Kuboň, Ph.D.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 14.11.2005
Datum zadání: 14.11.2005
Datum potvrzení stud. oddělením: 29.04.2013
Datum a čas obhajoby: 11.09.2006 00:00
Datum proběhlé obhajoby: 11.09.2006
Oponenti: RNDr. Martin Čmejrek, Ph.D.
 
 
 
Zásady pro vypracování
Náplní práce bude návrh a implementace metody, která by umožnila klasifikovat dvojjazyčná textová data z hlediska ekvivalence překladu. Metoda by měla být schopna oddělit data, kde se jedná o překlad více méně doslovný, a tedy vhodný jako trénovací data pro stochastické systémy automatického překladu, a data, která vznikla jako volný překlad a k podobnému účelu se nehodí.
Práce by měla obsahovat vyhodnocení souvislosti mezi názorem lidského překladatele a výsledkem automatického hodnocení. Kromě toho by také bylo vhodné ověřit na nějakém stochastickém překladovém systému hypotézu, zda se kvalita paralelních dvojjazyčných dat skutečně projeví na kvalitě výstupu.
Seznam odborné literatury
Anders Klevbacke: Parallel Text Alignment Algorithms. Chalmers University of Technology, 2001

Michael Schiehlen: Learning Tense Translation from Bilingual Corpora. University of Stuttgart, 1998

Jorge Civera, Elsa Cubel, Alfons Juan, and Enrique Vidal: Different Approaches to Bilingual Text Classification Based on Grammatical Inference Techniques. Universidad Politecnica de Valencia, 2003
 
Univerzita Karlova | Informační systém UK