Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Rozšířený HMM tagger a jeho aplikace na morfologické značkování češtiny
Název práce v češtině: Rozšířený HMM tagger a jeho aplikace na morfologické
značkování češtiny
Název v anglickém jazyce: Enhanced HMM Tagger and Its Application for Czech Morphological Tagging
Akademický rok vypsání: 2006/2007
Typ práce: bakalářská práce
Jazyk práce: čeština
Ústav: Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel: RNDr. Jiří Mírovský, Ph.D.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 15.10.2006
Datum zadání: 15.10.2006
Datum a čas obhajoby: 11.09.2007 00:00
Datum odevzdání elektronické podoby:11.09.2007
Datum proběhlé obhajoby: 11.09.2007
Oponenti: doc. Mgr. Barbora Vidová Hladká, Ph.D.
 
 
 
Zásady pro vypracování
Programovací jazyk: Java 1.5
Platforma: nezávislé (Java - kompatibilní)
Vstup: csts soubor s provedenou morfologickou analýzou
Výstup: csts soubor s vybranými správnými lemmaty a tagy (případně více možností u n-best), statistiky o úspěšnosti
Seznam odborné literatury
C. D. Manning and H. Schutze: Foundations of Statistical Natural Language Processing
Předběžná náplň práce
Vytvoření HMM taggeru s možností volby 'n' nejlepších průchodů ve Viterbiho algoritmu. Aplikace na morfologické značkování češtiny, ověření vlivu různě velikých trénovacích dat a nastavení parametru 'n' na úspěšnost tagování (precision, recall). Další experimenty jsou také možné, např. omezení sady tagů v historii značek a podobně.
Předběžná náplň práce v anglickém jazyce
Development of HMM tagger with the possibility of choosing n-best passes in Viterbi algorithm. Application on morphological tagging of Czech, verification of an infuence of various size of training data and of setting n-parameter on the success of the tagging (precision, recall). Other experiments are possible, too, e.g. reduction of tag set in history of tags etc.
 
Univerzita Karlova | Informační systém UK