Thesis (Selection of subject)Thesis (Selection of subject)(version: 390)
Thesis details
   Login via CAS
Automaticky generovaný překladový slovník německých složenin
Thesis title in Czech: Automaticky generovaný překladový slovník německých složenin
Thesis title in English: Automatic Extraction of Translation Dictionary of German Compound Nouns
Academic year of topic announcement: 2012/2013
Thesis type: school year task
Thesis language:
Department: Institute of Formal and Applied Linguistics (32-UFAL)
Supervisor: doc. RNDr. Ondřej Bojar, Ph.D.
Author:
Guidelines
Téma pro ročníkový projekt a navazující bakalářskou práci.

Němčina velmi často vytváří nová slova v podobě složenin. Pro systémy strojového překladu je zásadní mít přístup k rozsáhlému překladovému slovníku německých složenin. Přestože metody automatického získávání překladových slovníků z paralelních korpusů jsou již použitelné v praxi, současné paralelní korpusy rozhodně nestačí svým rozsahem.

Cílem ročníkového projektu a navazující bakalářské práce je implementovat systém pro získávání překladového slovníku složenin na základě (automaticky generovaného) překladového slovníku jednodušších slov a rozsáhlých jednojazyčných korpusů. Jednojazyčné korpusy, které jsou řádově větší než korpusy paralelní, budou sloužit zejména pro kontrolu existence německých složenin a českých sousloví.
References
M. Popović, D. Stein, and H. Ney. Statistical Machine Translation of German Compound Words. In FinTAL - 5th International Conference on Natural Language Processing, Springer Verlag, LNCS, pages 616-624, Turku, Finland, August 2006. http://www-i6.informatik.rwth-aachen.de/publications/download/365/Popovic--2006.pdf
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html