Thesis (Selection of subject)Thesis (Selection of subject)(version: 368)
Thesis details
   Login via CAS
Automatické hodnocení kvality paralelních dvojjazyčných dat
Thesis title in Czech: Automatické hodnocení kvality paralelních dvojjazyčných dat
Thesis title in English: Automatic Evaluation of Parallel Bilingual Data Quality
Academic year of topic announcement: 2005/2006
Thesis type: diploma thesis
Thesis language: čeština
Department: Institute of Formal and Applied Linguistics (32-UFAL)
Supervisor: doc. RNDr. Vladislav Kuboň, Ph.D.
Author: hidden - assigned and confirmed by the Study Dept.
Date of registration: 14.11.2005
Date of assignment: 14.11.2005
Date and time of defence: 31.05.2007 00:00
Date of electronic submission:31.05.2007
Date of proceeded defence: 31.05.2007
Opponents: doc. RNDr. Pavel Pecina, Ph.D.
 
 
 
Guidelines
Náplní práce bude návrh a implementace metody, která by umožnila klasifikovat dvojjazyčná textová data z hlediska ekvivalence překladu. Metoda by měla být schopna oddělit data, kde se jedná o překlad více méně doslovný, a tedy vhodný jako trénovací data pro stochastické systémy automatického překladu, a data, která vznikla jako volný překlad a k podobnému účelu se nehodí.
Práce by měla obsahovat vyhodnocení souvislosti mezi názorem lidského překladatele a výsledkem automatického hodnocení. Kromě toho by také bylo vhodné ověřit na nějakém stochastickém překladovém systému hypotézu, zda se kvalita paralelních dvojjazyčných dat skutečně projeví na kvalitě výstupu.
References
Anders Klevbacke: Parallel Text Alignment Algorithms. Chalmers University of Technology, 2001

Michael Schiehlen: Learning Tense Translation from Bilingual Corpora. University of Stuttgart, 1998

Jorge Civera, Elsa Cubel, Alfons Juan, and Enrique Vidal: Different Approaches to Bilingual Text Classification Based on Grammatical Inference Techniques. Universidad Politecnica de Valencia, 2003
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html