Automaticky generovaný překladový slovník německých složenin
Thesis title in Czech: | Automaticky generovaný překladový slovník německých složenin |
---|---|
Thesis title in English: | Automatic Extraction of Translation Dictionary of German Compound Nouns |
Academic year of topic announcement: | 2012/2013 |
Thesis type: | school year task |
Thesis language: | |
Department: | Institute of Formal and Applied Linguistics (32-UFAL) |
Supervisor: | doc. RNDr. Ondřej Bojar, Ph.D. |
Author: |
Guidelines |
Téma pro ročníkový projekt a navazující bakalářskou práci.
Němčina velmi často vytváří nová slova v podobě složenin. Pro systémy strojového překladu je zásadní mít přístup k rozsáhlému překladovému slovníku německých složenin. Přestože metody automatického získávání překladových slovníků z paralelních korpusů jsou již použitelné v praxi, současné paralelní korpusy rozhodně nestačí svým rozsahem. Cílem ročníkového projektu a navazující bakalářské práce je implementovat systém pro získávání překladového slovníku složenin na základě (automaticky generovaného) překladového slovníku jednodušších slov a rozsáhlých jednojazyčných korpusů. Jednojazyčné korpusy, které jsou řádově větší než korpusy paralelní, budou sloužit zejména pro kontrolu existence německých složenin a českých sousloví. |
References |
M. Popović, D. Stein, and H. Ney. Statistical Machine Translation of German Compound Words. In FinTAL - 5th International Conference on Natural Language Processing, Springer Verlag, LNCS, pages 616-624, Turku, Finland, August 2006. http://www-i6.informatik.rwth-aachen.de/publications/download/365/Popovic--2006.pdf |