Morfologická disambiguace češtiny pomocí Markovkých modelů
Thesis title in Czech: | Morfologická disambiguace češtiny pomocí Markovkých modelů |
---|---|
Thesis title in English: | Disambiguation of Czech Morphology Using Markov Models |
Academic year of topic announcement: | 2005/2006 |
Thesis type: | Bachelor's thesis |
Thesis language: | čeština |
Department: | Institute of Formal and Applied Linguistics (32-UFAL) |
Supervisor: | RNDr. Petr Podveský, Ph.D. |
Author: | hidden![]() |
Date of registration: | 18.10.2005 |
Date of assignment: | 18.10.2005 |
Date and time of defence: | 26.06.2006 00:00 |
Date of electronic submission: | 26.06.2006 |
Date of proceeded defence: | 26.06.2006 |
Opponents: | doc. Mgr. Barbora Vidová Hladká, Ph.D. |
Guidelines |
Softwarový nástroj bude implementován v C/C++. Měl by fungovat v operačních systémech Windows a Linux jako program spustitelný z příkazové řádky. Parametry modelu, odkazy na trénovací a testovací soubory se budou zadávat jako parametry programu, grafické rozhraní je nad rámec požadavků.
|
References |
Foundations of Statistical Natural Language Processing
Christopher D. Manning, Hinrich Schutze The MIT Press, 1999 Serial Combination of Rules and Statistics: A Case Study in Czech Tagging Hajič J., Krbec P., Oliva K., Květoň P., Petkevič V. In Proceedings of ACL 2001, Toulouse, France |
Preliminary scope of work |
Cílem bakalářské práce je vytvořit nástroj pro automatickou disambiguaci morfologických značek. Jako matematematický aparát budou využity Markovské modely s pamětí omezenou na bezprostředně předchozí značku (tzv. bigramový model). Součástí řešení bude experimentální vyhodnocení na datech z Pražského závislostních korpusu (PDT 2.0). |