Cílem bakalářské práce je efektivně implementovat některou ze známých metod pro automatické vytvoření seznamu českých předpon na základě velkého množství (statisíce) českých slov, případně se pokusit tyto metody zkombinovat či vylepšit.
Seznam odborné literatury
A. Medina Urrea: Automatic Discovery of Affixes by means of a Corpus. Journal of Quantitative Linguistics 2000/2, pp. 97-114.
A. Medina Urrea, J. Hlaváčová: Automatic Recognition of Czech Derivational Prefixes. Proceedings CICLing 2005, pp. 189-197, Springer-Verlag 2005.
Předběžná náplň práce
V češtině se, zvláště v poslední době, vytvářejí nová slova pomocí cizích předpon, např. mini-, maxi-, endo-, exo-, foto-, euro-. Není možné každé takto vzniklé slovo zahrnout do slovníku, a přesto je třeba tato slova rozpoznávat. K tomu je nutné vytvořit seznam takových předpon.