Témata prací (Výběr práce)

Váš prohlížeč nepodporuje JavaScript nebo je jeho podpora vypnutá. Některé funkce nemusejí být dostupné.

Automatická analýza češtiny bez slovníku

Název práce v češtině:	Automatická analýza češtiny bez slovníku
Název v anglickém jazyce:	Automatic Analysis of the Czech without dictionary
Klíčová slova:	jazykový korpus, korpusová lingvistika
Klíčová slova anglicky:	corpus, corpus linguistics
Akademický rok vypsání:	2016/2017
Typ práce:	bakalářská práce
Jazyk práce:	čeština
Ústav:	Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel:	RNDr. Jaroslava Hlaváčová, Ph.D.
Řešitel:

Zásady pro vypracování

Cílem práce je vytvořit nástroj pro morfologické značkování českého textu bez použití slovníku.
Každému slovu je třeba přiřadit značku, která popisuje jeho morfologické vlastnosti (rod, číslo, pád, apod.).
Součástí práce bude porovnání úspěšnosti s používanou morfologickou analýzou, která využívá slovník.

Seznam odborné literatury

Patrice Pognan: Automatická analýza češtiny bez slovníku a “předvídatelnost” západních slovanských jazyků
Hajič Jan: Disambiguation of Rich Inflection. Praha, Karolinum 2004.
Hlaváčová Jaroslava: Morphological Guesser of Czech Words. Proc. TSD 2001, p. 70-75. Springer-Verlag 2001