Thesis (Selection of subject)Thesis (Selection of subject)(version: 368)
Thesis details
   Login via CAS
Rozšířený HMM tagger a jeho aplikace na morfologické značkování češtiny
Thesis title in Czech: Rozšířený HMM tagger a jeho aplikace na morfologické
značkování češtiny
Thesis title in English: Enhanced HMM Tagger and Its Application for Czech Morphological Tagging
Academic year of topic announcement: 2006/2007
Thesis type: Bachelor's thesis
Thesis language: čeština
Department: Institute of Formal and Applied Linguistics (32-UFAL)
Supervisor: RNDr. Jiří Mírovský, Ph.D.
Author: hidden - assigned and confirmed by the Study Dept.
Date of registration: 15.10.2006
Date of assignment: 15.10.2006
Date and time of defence: 11.09.2007 00:00
Date of electronic submission:11.09.2007
Date of proceeded defence: 11.09.2007
Opponents: doc. Mgr. Barbora Vidová Hladká, Ph.D.
 
 
 
Guidelines
Programovací jazyk: Java 1.5
Platforma: nezávislé (Java - kompatibilní)
Vstup: csts soubor s provedenou morfologickou analýzou
Výstup: csts soubor s vybranými správnými lemmaty a tagy (případně více možností u n-best), statistiky o úspěšnosti
References
C. D. Manning and H. Schutze: Foundations of Statistical Natural Language Processing
Preliminary scope of work
Vytvoření HMM taggeru s možností volby 'n' nejlepších průchodů ve Viterbiho algoritmu. Aplikace na morfologické značkování češtiny, ověření vlivu různě velikých trénovacích dat a nastavení parametru 'n' na úspěšnost tagování (precision, recall). Další experimenty jsou také možné, např. omezení sady tagů v historii značek a podobně.
Preliminary scope of work in English
Development of HMM tagger with the possibility of choosing n-best passes in Viterbi algorithm. Application on morphological tagging of Czech, verification of an infuence of various size of training data and of setting n-parameter on the success of the tagging (precision, recall). Other experiments are possible, too, e.g. reduction of tag set in history of tags etc.
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html