Thesis (Selection of subject)Thesis (Selection of subject)(version: 368)
Thesis details
   Login via CAS
Automatická kontrola a oprava pravopisných chyb
Thesis title in Czech: Automatická kontrola a oprava pravopisných chyb
Thesis title in English: Automatic checking and correction of spelling errors
Key words: kontrola pravopisu, jazykové modelování
English key words: spell checking, language modeling
Academic year of topic announcement: 2014/2015
Thesis type: diploma thesis
Thesis language:
Department: Institute of Formal and Applied Linguistics (32-UFAL)
Supervisor: doc. RNDr. Pavel Pecina, Ph.D.
Author:
Guidelines
Kontrola pravopisu je dnes již běžnou součástí textových editorů. Většina používaných metod je založena na slovnících a měření podobnosti slov (např. editační vzdálenosti), pokročilejší metody používají navíc např. i jazykové modelování a pracují s širším kontextem. Kontrola pravopisu funguje ve většině případů pouze jako (on-line) pomocník při psaní textu v a vyžaduje zásah uživatele (při výběru správného slovního tvaru z nabízených alternativ). Použití kontroly (a oprav) pravopisu je ovšem žádoucí i bez nutnosti zásahu uživatele (off-line), např. u již existujících textů, které není možné kvůli jejich objemu kontrolovat ručně, či při vkládání textů do různých informačních systémů, kde by mohla další intervence uživatele obtěžovat (např. při vkládání textu bez diakritiky).

Cílem diplomové práce je navrhnout, implementovat a evaluovat systém pro kontrolu a opravu pravopisných chyb bez nutnosti zásahu uživatele. Řešení práce bude obsahovat moduly pro detekci nekorektních slovních tvarů, návrh korektních alternativ a hledání globálně optimální sekvence korektních tvarů v textu.
References
Chris Manning and Hinrich Schütze, Foundations of Statistical Natural Language Processing, MIT Press. Cambridge, MA.1999.
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html