Thesis (Selection of subject)Thesis (Selection of subject)(version: 368)
Thesis details
   Login via CAS
Automatické určování zájmenné koreference v češtině
Thesis title in Czech: Automatické určování zájmenné koreference v češtině
Thesis title in English: Automatic Resolution of Pronoun Coreference in Czech
Key words: zájmenná koreference, automatické určování, strojové učení
English key words: pronomial coreference, automatic resolution, machine learning
Academic year of topic announcement: 2009/2010
Thesis type: Bachelor's thesis
Thesis language: čeština
Department: Institute of Formal and Applied Linguistics (32-UFAL)
Supervisor: RNDr. Jiří Mírovský, Ph.D.
Author: hidden - assigned and confirmed by the Study Dept.
Date of registration: 07.10.2009
Date of assignment: 28.01.2010
Date and time of defence: 16.09.2010 00:00
Date of electronic submission:06.08.2010
Date of submission of printed version:06.08.2010
Date of proceeded defence: 16.09.2010
Opponents: doc. Mgr. Barbora Vidová Hladká, Ph.D.
 
 
 
Guidelines
Cílem této bakalářské práce, která navazuje na ročníkový projekt, je vytvořit automatickou proceduru značkování zájmenné koreference v českém textu. Vstupem programu bude text anotovaný na morfologické a analytické rovině dle systému Pražského závislostního korpusu. Program bude využívat některou metodu strojového učení, pro jejíž trénování použije ručně anotovaná data Pražského závislostního korpusu. Součástí práce bude vyhodnocení výsledků.
jazyk: libovolný
platforma: Linux
References
Mitchel, T.M. Machine Learning. McGraw-Hill. 1997
Preliminary scope of work
Cílem této bakalářské práce, která navazuje na ročníkový projekt, je vytvořit automatickou proceduru značkování zájmenné koreference v českém textu. Vstupem programu bude text anotovaný na morfologické a analytické rovině dle systému Pražského závislostního korpusu. Program bude využívat některou metodu strojového učení, pro jejíž trénování použije ručně anotovaná data Pražského závislostního korpusu. Součástí práce bude vyhodnocení výsledků.
Preliminary scope of work in English
The goal of the bachelor thesis is an implementation of a procedure for automatic pronominal coreference resolution in Czech texts. The input of the program will be a morphologically and analytically annotated text (based on the system of the Prague Dependency Treebank). The program will use a machine learning method; for its training, manually annotated data from the Prague Dependency Treebank will be used. Evaluation of the results will be a part of the thesis.
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html