Thesis (Selection of subject)Thesis (Selection of subject)(version: 368)
Thesis details
   Login via CAS
Automatická analýza češtiny bez slovníku
Thesis title in Czech: Automatická analýza češtiny bez slovníku
Thesis title in English: Automatic Analysis of the Czech without dictionary
Key words: jazykový korpus, korpusová lingvistika
English key words: corpus, corpus linguistics
Academic year of topic announcement: 2016/2017
Thesis type: Bachelor's thesis
Thesis language: čeština
Department: Institute of Formal and Applied Linguistics (32-UFAL)
Supervisor: RNDr. Jaroslava Hlaváčová, Ph.D.
Author:
Guidelines
Cílem práce je vytvořit nástroj pro morfologické značkování českého textu bez použití slovníku.
Každému slovu je třeba přiřadit značku, která popisuje jeho morfologické vlastnosti (rod, číslo, pád, apod.).
Součástí práce bude porovnání úspěšnosti s používanou morfologickou analýzou, která využívá slovník.
References
Patrice Pognan: Automatická analýza češtiny bez slovníku a “předvídatelnost” západních slovanských jazyků
Hajič Jan: Disambiguation of Rich Inflection. Praha, Karolinum 2004.
Hlaváčová Jaroslava: Morphological Guesser of Czech Words. Proc. TSD 2001, p. 70-75. Springer-Verlag 2001
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html