Thesis (Selection of subject)Thesis (Selection of subject)(version: 368)
Thesis details
   Login via CAS
Pokročilý korektor češtiny
Thesis title in Czech: Pokročilý korektor češtiny
Thesis title in English: Advanced Czech Spellchecker
Academic year of topic announcement: 2009/2010
Thesis type: diploma thesis
Thesis language: angličtina
Department: Institute of Formal and Applied Linguistics (32-UFAL)
Supervisor: Mgr. Pavel Straňák, Ph.D.
Author: hidden - assigned and confirmed by the Study Dept.
Date of registration: 23.06.2009
Date of assignment: 23.06.2009
Date and time of defence: 06.09.2010 00:00
Date of electronic submission:06.09.2010
Date of proceeded defence: 06.09.2010
Opponents: doc. Ing. Zdeněk Žabokrtský, Ph.D.
 
 
 
Guidelines
Cílem práce je navrhnout a implementovat spellchecker, který bude využívat morfologického slovníku a tezauru vyvinutého na UFALu. Zároveň bude klíčovou vlastností schopnost nalézt překlep, který tvoří správně zformované české slovo (a tedy je takové slovo ve slovníku).

Nástroj bude využívat možností nabízených morfologickým slovníkem pro omezení stylových variant, bude korigovat jak text s akcenty, tak bez nich i text s akcenty zapsanými TeXovými sekvencemi, to vše i v jednom dokumentu. Důležitou součástí systému bude také optimalizace nabízených náhrad podle jejich pravděpodobnosti. Dále nástroj nabídne možnost z textu diakritiku odstranit či ji přidat do textu, kde diakritika není. Tezaurus bude nabízet k danému slovnímu tvaru synonyma správně vyskloňovaná, časovaná, stupňovaná a negovaná.

Celý systém bude implementován Spell Server pro Mac OS X nebo jako webová aplikace.

References
Christopher D. Manning, Hinrich Schutze. 1999. Foundations of Statistical Natural Language Processing, The MIT Press

Jiří Hana, Daniel Zeman, Jan Hajič, Hana Hanová, Barbora Hladká, Emil Jeřábek. Manual for Morphological Annotation, Revision for the Prague Dependency Treebank 2.0. Technical report UFAL, TR-2005-27, Prague, Czech Rep.: 2005.

Apple Developer Connection: Spell Checking. http://developer.apple.com/documentation/Cocoa/Conceptual/SpellCheck/index.html
Apple Developer Connection: System Services. http://developer.apple.com/documentation/Cocoa/Conceptual/SysServices/index.html
Preliminary scope of work
- pro ročníkový projekt nebo bakalářskou práci jen vybraný problém či podmnožinu
Preliminary scope of work in English
An advanced spellchecker integrating thesaurus, morphological analyser and language models.
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html