Rozšířený HMM tagger a jeho aplikace na morfologické značkování češtiny
| Název práce v češtině: | Rozšířený HMM tagger a jeho aplikace na morfologické značkování češtiny |
|---|---|
| Název v anglickém jazyce: | Enhanced HMM Tagger and Its Application for Czech Morphological Tagging |
| Akademický rok vypsání: | 2006/2007 |
| Typ práce: | bakalářská práce |
| Jazyk práce: | čeština |
| Ústav: | Ústav formální a aplikované lingvistiky (32-UFAL) |
| Vedoucí / školitel: | RNDr. Jiří Mírovský, Ph.D. |
| Řešitel: | skrytý - zadáno a potvrzeno stud. odd. |
| Datum přihlášení: | 15.10.2006 |
| Datum zadání: | 15.10.2006 |
| Datum a čas obhajoby: | 11.09.2007 00:00 |
| Datum odevzdání elektronické podoby: | 11.09.2007 |
| Datum proběhlé obhajoby: | 11.09.2007 |
| Oponenti: | doc. Mgr. Barbora Vidová Hladká, Ph.D. |
| Zásady pro vypracování |
| Programovací jazyk: Java 1.5
Platforma: nezávislé (Java - kompatibilní) Vstup: csts soubor s provedenou morfologickou analýzou Výstup: csts soubor s vybranými správnými lemmaty a tagy (případně více možností u n-best), statistiky o úspěšnosti |
| Seznam odborné literatury |
| C. D. Manning and H. Schutze: Foundations of Statistical Natural Language Processing |
| Předběžná náplň práce |
| Vytvoření HMM taggeru s možností volby 'n' nejlepších průchodů ve Viterbiho algoritmu. Aplikace na morfologické značkování češtiny, ověření vlivu různě velikých trénovacích dat a nastavení parametru 'n' na úspěšnost tagování (precision, recall). Další experimenty jsou také možné, např. omezení sady tagů v historii značek a podobně. |
| Předběžná náplň práce v anglickém jazyce |
| Development of HMM tagger with the possibility of choosing n-best passes in Viterbi algorithm. Application on morphological tagging of Czech, verification of an infuence of various size of training data and of setting n-parameter on the success of the tagging (precision, recall). Other experiments are possible, too, e.g. reduction of tag set in history of tags etc. |
- zadáno a potvrzeno stud. odd.