Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Automatická analýza češtiny bez slovníku
Název práce v češtině: Automatická analýza češtiny bez slovníku
Název v anglickém jazyce: Automatic Analysis of the Czech without dictionary
Klíčová slova: jazykový korpus, korpusová lingvistika
Klíčová slova anglicky: corpus, corpus linguistics
Akademický rok vypsání: 2016/2017
Typ práce: bakalářská práce
Jazyk práce: čeština
Ústav: Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel: RNDr. Jaroslava Hlaváčová, Ph.D.
Řešitel:
Zásady pro vypracování
Cílem práce je vytvořit nástroj pro morfologické značkování českého textu bez použití slovníku.
Každému slovu je třeba přiřadit značku, která popisuje jeho morfologické vlastnosti (rod, číslo, pád, apod.).
Součástí práce bude porovnání úspěšnosti s používanou morfologickou analýzou, která využívá slovník.
Seznam odborné literatury
Patrice Pognan: Automatická analýza češtiny bez slovníku a “předvídatelnost” západních slovanských jazyků
Hajič Jan: Disambiguation of Rich Inflection. Praha, Karolinum 2004.
Hlaváčová Jaroslava: Morphological Guesser of Czech Words. Proc. TSD 2001, p. 70-75. Springer-Verlag 2001
 
Univerzita Karlova | Informační systém UK