Automatická analýza češtiny bez slovníku
Thesis title in Czech: | Automatická analýza češtiny bez slovníku |
---|---|
Thesis title in English: | Automatic Analysis of the Czech without dictionary |
Key words: | jazykový korpus, korpusová lingvistika |
English key words: | corpus, corpus linguistics |
Academic year of topic announcement: | 2016/2017 |
Thesis type: | Bachelor's thesis |
Thesis language: | čeština |
Department: | Institute of Formal and Applied Linguistics (32-UFAL) |
Supervisor: | RNDr. Jaroslava Hlaváčová, Ph.D. |
Author: |
Guidelines |
Cílem práce je vytvořit nástroj pro morfologické značkování českého textu bez použití slovníku.
Každému slovu je třeba přiřadit značku, která popisuje jeho morfologické vlastnosti (rod, číslo, pád, apod.). Součástí práce bude porovnání úspěšnosti s používanou morfologickou analýzou, která využívá slovník. |
References |
Patrice Pognan: Automatická analýza češtiny bez slovníku a “předvídatelnost” západních slovanských jazyků
Hajič Jan: Disambiguation of Rich Inflection. Praha, Karolinum 2004. Hlaváčová Jaroslava: Morphological Guesser of Czech Words. Proc. TSD 2001, p. 70-75. Springer-Verlag 2001 |