Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 356)
Detail práce
   Přihlásit přes CAS
Automatické určování zájmenné koreference v češtině
Název práce v češtině: Automatické určování zájmenné koreference v češtině
Název v anglickém jazyce: Automatic Resolution of Pronoun Coreference in Czech
Klíčová slova: zájmenná koreference, automatické určování, strojové učení
Klíčová slova anglicky: pronomial coreference, automatic resolution, machine learning
Akademický rok vypsání: 2009/2010
Typ práce: bakalářská práce
Jazyk práce: čeština
Ústav: Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel: RNDr. Jiří Mírovský, Ph.D.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 07.10.2009
Datum zadání: 28.01.2010
Datum a čas obhajoby: 16.09.2010 00:00
Datum odevzdání elektronické podoby:06.08.2010
Datum odevzdání tištěné podoby:06.08.2010
Datum proběhlé obhajoby: 16.09.2010
Oponenti: doc. Mgr. Barbora Vidová Hladká, Ph.D.
 
 
 
Zásady pro vypracování
Cílem této bakalářské práce, která navazuje na ročníkový projekt, je vytvořit automatickou proceduru značkování zájmenné koreference v českém textu. Vstupem programu bude text anotovaný na morfologické a analytické rovině dle systému Pražského závislostního korpusu. Program bude využívat některou metodu strojového učení, pro jejíž trénování použije ručně anotovaná data Pražského závislostního korpusu. Součástí práce bude vyhodnocení výsledků.
jazyk: libovolný
platforma: Linux
Seznam odborné literatury
Mitchel, T.M. Machine Learning. McGraw-Hill. 1997
Předběžná náplň práce
Cílem této bakalářské práce, která navazuje na ročníkový projekt, je vytvořit automatickou proceduru značkování zájmenné koreference v českém textu. Vstupem programu bude text anotovaný na morfologické a analytické rovině dle systému Pražského závislostního korpusu. Program bude využívat některou metodu strojového učení, pro jejíž trénování použije ručně anotovaná data Pražského závislostního korpusu. Součástí práce bude vyhodnocení výsledků.
Předběžná náplň práce v anglickém jazyce
The goal of the bachelor thesis is an implementation of a procedure for automatic pronominal coreference resolution in Czech texts. The input of the program will be a morphologically and analytically annotated text (based on the system of the Prague Dependency Treebank). The program will use a machine learning method; for its training, manually annotated data from the Prague Dependency Treebank will be used. Evaluation of the results will be a part of the thesis.
 
Univerzita Karlova | Informační systém UK