Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Pokročilý korektor češtiny
Název práce v češtině: Pokročilý korektor češtiny
Název v anglickém jazyce: Advanced Czech Spellchecker
Akademický rok vypsání: 2009/2010
Typ práce: diplomová práce
Jazyk práce: angličtina
Ústav: Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel: Mgr. Pavel Straňák, Ph.D.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 23.06.2009
Datum zadání: 23.06.2009
Datum a čas obhajoby: 06.09.2010 00:00
Datum odevzdání elektronické podoby:06.09.2010
Datum proběhlé obhajoby: 06.09.2010
Oponenti: doc. Ing. Zdeněk Žabokrtský, Ph.D.
 
 
 
Zásady pro vypracování
Cílem práce je navrhnout a implementovat spellchecker, který bude využívat morfologického slovníku a tezauru vyvinutého na UFALu. Zároveň bude klíčovou vlastností schopnost nalézt překlep, který tvoří správně zformované české slovo (a tedy je takové slovo ve slovníku).

Nástroj bude využívat možností nabízených morfologickým slovníkem pro omezení stylových variant, bude korigovat jak text s akcenty, tak bez nich i text s akcenty zapsanými TeXovými sekvencemi, to vše i v jednom dokumentu. Důležitou součástí systému bude také optimalizace nabízených náhrad podle jejich pravděpodobnosti. Dále nástroj nabídne možnost z textu diakritiku odstranit či ji přidat do textu, kde diakritika není. Tezaurus bude nabízet k danému slovnímu tvaru synonyma správně vyskloňovaná, časovaná, stupňovaná a negovaná.

Celý systém bude implementován Spell Server pro Mac OS X nebo jako webová aplikace.

Seznam odborné literatury
Christopher D. Manning, Hinrich Schutze. 1999. Foundations of Statistical Natural Language Processing, The MIT Press

Jiří Hana, Daniel Zeman, Jan Hajič, Hana Hanová, Barbora Hladká, Emil Jeřábek. Manual for Morphological Annotation, Revision for the Prague Dependency Treebank 2.0. Technical report UFAL, TR-2005-27, Prague, Czech Rep.: 2005.

Apple Developer Connection: Spell Checking. http://developer.apple.com/documentation/Cocoa/Conceptual/SpellCheck/index.html
Apple Developer Connection: System Services. http://developer.apple.com/documentation/Cocoa/Conceptual/SysServices/index.html
Předběžná náplň práce
- pro ročníkový projekt nebo bakalářskou práci jen vybraný problém či podmnožinu
Předběžná náplň práce v anglickém jazyce
An advanced spellchecker integrating thesaurus, morphological analyser and language models.
 
Univerzita Karlova | Informační systém UK