Automatická analýza češtiny bez slovníku
Název práce v češtině: | Automatická analýza češtiny bez slovníku |
---|---|
Název v anglickém jazyce: | Automatic Analysis of the Czech without dictionary |
Klíčová slova: | jazykový korpus, korpusová lingvistika |
Klíčová slova anglicky: | corpus, corpus linguistics |
Akademický rok vypsání: | 2016/2017 |
Typ práce: | bakalářská práce |
Jazyk práce: | čeština |
Ústav: | Ústav formální a aplikované lingvistiky (32-UFAL) |
Vedoucí / školitel: | RNDr. Jaroslava Hlaváčová, Ph.D. |
Řešitel: |
Zásady pro vypracování |
Cílem práce je vytvořit nástroj pro morfologické značkování českého textu bez použití slovníku.
Každému slovu je třeba přiřadit značku, která popisuje jeho morfologické vlastnosti (rod, číslo, pád, apod.). Součástí práce bude porovnání úspěšnosti s používanou morfologickou analýzou, která využívá slovník. |
Seznam odborné literatury |
Patrice Pognan: Automatická analýza češtiny bez slovníku a “předvídatelnost” západních slovanských jazyků
Hajič Jan: Disambiguation of Rich Inflection. Praha, Karolinum 2004. Hlaváčová Jaroslava: Morphological Guesser of Czech Words. Proc. TSD 2001, p. 70-75. Springer-Verlag 2001 |