Cílem této bakalářské práce, která navazuje na ročníkový projekt, je vytvořit automatickou proceduru značkování zájmenné koreference v českém textu. Vstupem programu bude text anotovaný na morfologické a analytické rovině dle systému Pražského závislostního korpusu. Program bude využívat některou metodu strojového učení, pro jejíž trénování použije ručně anotovaná data Pražského závislostního korpusu. Součástí práce bude vyhodnocení výsledků.
jazyk: libovolný
platforma: Linux
Seznam odborné literatury
Mitchel, T.M. Machine Learning. McGraw-Hill. 1997
Předběžná náplň práce
Cílem této bakalářské práce, která navazuje na ročníkový projekt, je vytvořit automatickou proceduru značkování zájmenné koreference v českém textu. Vstupem programu bude text anotovaný na morfologické a analytické rovině dle systému Pražského závislostního korpusu. Program bude využívat některou metodu strojového učení, pro jejíž trénování použije ručně anotovaná data Pražského závislostního korpusu. Součástí práce bude vyhodnocení výsledků.
Předběžná náplň práce v anglickém jazyce
The goal of the bachelor thesis is an implementation of a procedure for automatic pronominal coreference resolution in Czech texts. The input of the program will be a morphologically and analytically annotated text (based on the system of the Prague Dependency Treebank). The program will use a machine learning method; for its training, manually annotated data from the Prague Dependency Treebank will be used. Evaluation of the results will be a part of the thesis.