Podpora rozpoznávání matematických vzorců v rámci OCR systému
Název práce v jazyce práce (slovenština): | Podpora rozpoznávání matematických vzorců v rámci OCR systému |
---|---|
Název práce v češtině: | Podpora rozpoznávání matematických vzorců v rámci OCR systému |
Název v anglickém jazyce: | Optical Formula Recognition support as a part of the OCR system |
Klíčová slova: | rozpoznávanie matematických vzorcov, rozpoznávanie symbolov, podporné vektory, Kohonenova mapa |
Klíčová slova anglicky: | mathematical formula recognition, symbol recognition, support vector machines, Kohonen's map |
Akademický rok vypsání: | 2010/2011 |
Typ práce: | diplomová práce |
Jazyk práce: | slovenština |
Ústav: | Katedra softwarového inženýrství (32-KSI) |
Vedoucí / školitel: | Ing. Tomáš Suk, CSc. |
Řešitel: | skrytý![]() |
Datum přihlášení: | 25.02.2011 |
Datum zadání: | 25.02.2011 |
Datum a čas obhajoby: | 05.09.2011 12:30 |
Datum odevzdání elektronické podoby: | 01.08.2011 |
Datum odevzdání tištěné podoby: | 05.08.2011 |
Datum proběhlé obhajoby: | 05.09.2011 |
Oponenti: | RNDr. Pavel Vácha, Ph.D. |
Zásady pro vypracování |
Zatímco na převod obrazové podoby textu, např. získaného ze scanneru, do textové podoby (tzv. OCR - Optical Character Recognition) dnes už existuje komerční software, rozpoznávání matematických vzorců je teprve v začátcích. Rozpoznávání se dá rozložit na dvě fáze, rozpoznávání struktury vzorce a rozpoznávání jednotlivých znaků. Zatímco rozpoznávání znaků je podobné OCR s tím rozdílem, že množina znaků je širší, rozpoznávání struktury je specifický problém. Součástí práce by měla být rešerše literatury, která byla o problému publikována (např. [1], [2], [3]), naprogramování jednoho vybraného řešení a uživatelská příručka. Navržený software by měl být otevřený, tzn. mělo by být možné v případě potřeby do něj přidávat zápisy nových matematických operací a měl by mít i jistou odolnost vůči šumu ve vstupním obrazu. Výstupem by měl být text v nějakém jazyce pro zápis matematických vzorců, např. Latex.
|
Seznam odborné literatury |
[1] Masakazu Suzuki, Fumikazu Tamari, Ryoji Fukuda, Seiichi Uchida and Toshikiro Kanahori: INFTY - An integrated OCR system for mathematical documents, Proceedings of the ACM symposium on Document engineering (DocEng'03), Grenoble, 2003.
[2] Xue-Dong Tian, Hai-Yan Li, Xin-Fu Li and Li-Ping Zhang: Research on Symbol Recognition for Mathematical Expressions, First International Conference on Innovative Computing, Information and Control (ICICIC'06), Beijing, 2006. [3] Francisco Álvaro and Joan Andreu Sánchez: Comparing Several Techniques for Offline Recognition of Printed Mathematical Symbols, 20th International Conference on Pattern Recognition (ICPR'10), Istanbul, 2010. |