Thesis (Selection of subject)Thesis (Selection of subject)(version: 390)
Thesis details
   Login via CAS
Morfologická disambiguace češtiny pomocí Markovkých modelů
Thesis title in Czech: Morfologická disambiguace češtiny pomocí Markovkých modelů
Thesis title in English: Disambiguation of Czech Morphology Using Markov Models
Academic year of topic announcement: 2005/2006
Thesis type: Bachelor's thesis
Thesis language: čeština
Department: Institute of Formal and Applied Linguistics (32-UFAL)
Supervisor: RNDr. Petr Podveský, Ph.D.
Author: hidden - assigned and confirmed by the Study Dept.
Date of registration: 18.10.2005
Date of assignment: 18.10.2005
Date and time of defence: 26.06.2006 00:00
Date of electronic submission:26.06.2006
Date of proceeded defence: 26.06.2006
Opponents: doc. Mgr. Barbora Vidová Hladká, Ph.D.
 
 
 
Guidelines
Softwarový nástroj bude implementován v C/C++. Měl by fungovat v operačních systémech Windows a Linux jako program spustitelný z příkazové řádky. Parametry modelu, odkazy na trénovací a testovací soubory se budou zadávat jako parametry programu, grafické rozhraní je nad rámec požadavků.
References
Foundations of Statistical Natural Language Processing
Christopher D. Manning, Hinrich Schutze
The MIT Press, 1999

Serial Combination of Rules and Statistics: A Case Study in Czech Tagging
Hajič J., Krbec P., Oliva K., Květoň P., Petkevič V.
In Proceedings of ACL 2001, Toulouse, France
Preliminary scope of work
Cílem bakalářské práce je vytvořit nástroj pro automatickou disambiguaci morfologických značek. Jako matematematický aparát budou využity Markovské modely s pamětí omezenou na bezprostředně předchozí značku (tzv. bigramový model). Součástí řešení bude experimentální vyhodnocení na datech z Pražského závislostních korpusu (PDT 2.0).
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html