Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 390)
Detail práce
   Přihlásit přes CAS
Automaticky generovaný překladový slovník německých složenin
Název práce v češtině: Automaticky generovaný překladový slovník německých složenin
Název v anglickém jazyce: Automatic Extraction of Translation Dictionary of German Compound Nouns
Akademický rok vypsání: 2012/2013
Typ práce: ročníková práce
Jazyk práce:
Ústav: Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel: doc. RNDr. Ondřej Bojar, Ph.D.
Řešitel:
Zásady pro vypracování
Téma pro ročníkový projekt a navazující bakalářskou práci.

Němčina velmi často vytváří nová slova v podobě složenin. Pro systémy strojového překladu je zásadní mít přístup k rozsáhlému překladovému slovníku německých složenin. Přestože metody automatického získávání překladových slovníků z paralelních korpusů jsou již použitelné v praxi, současné paralelní korpusy rozhodně nestačí svým rozsahem.

Cílem ročníkového projektu a navazující bakalářské práce je implementovat systém pro získávání překladového slovníku složenin na základě (automaticky generovaného) překladového slovníku jednodušších slov a rozsáhlých jednojazyčných korpusů. Jednojazyčné korpusy, které jsou řádově větší než korpusy paralelní, budou sloužit zejména pro kontrolu existence německých složenin a českých sousloví.
Seznam odborné literatury
M. Popović, D. Stein, and H. Ney. Statistical Machine Translation of German Compound Words. In FinTAL - 5th International Conference on Natural Language Processing, Springer Verlag, LNCS, pages 616-624, Turku, Finland, August 2006. http://www-i6.informatik.rwth-aachen.de/publications/download/365/Popovic--2006.pdf
 
Univerzita Karlova | Informační systém UK