Automaticky generovaný překladový slovník německých složenin
Název práce v češtině: | Automaticky generovaný překladový slovník německých složenin |
---|---|
Název v anglickém jazyce: | Automatic Extraction of Translation Dictionary of German Compound Nouns |
Akademický rok vypsání: | 2012/2013 |
Typ práce: | ročníková práce |
Jazyk práce: | |
Ústav: | Ústav formální a aplikované lingvistiky (32-UFAL) |
Vedoucí / školitel: | doc. RNDr. Ondřej Bojar, Ph.D. |
Řešitel: |
Zásady pro vypracování |
Téma pro ročníkový projekt a navazující bakalářskou práci.
Němčina velmi často vytváří nová slova v podobě složenin. Pro systémy strojového překladu je zásadní mít přístup k rozsáhlému překladovému slovníku německých složenin. Přestože metody automatického získávání překladových slovníků z paralelních korpusů jsou již použitelné v praxi, současné paralelní korpusy rozhodně nestačí svým rozsahem. Cílem ročníkového projektu a navazující bakalářské práce je implementovat systém pro získávání překladového slovníku složenin na základě (automaticky generovaného) překladového slovníku jednodušších slov a rozsáhlých jednojazyčných korpusů. Jednojazyčné korpusy, které jsou řádově větší než korpusy paralelní, budou sloužit zejména pro kontrolu existence německých složenin a českých sousloví. |
Seznam odborné literatury |
M. Popović, D. Stein, and H. Ney. Statistical Machine Translation of German Compound Words. In FinTAL - 5th International Conference on Natural Language Processing, Springer Verlag, LNCS, pages 616-624, Turku, Finland, August 2006. http://www-i6.informatik.rwth-aachen.de/publications/download/365/Popovic--2006.pdf |