Témata prací (Výběr práce)

Váš prohlížeč nepodporuje JavaScript nebo je jeho podpora vypnutá. Některé funkce nemusejí být dostupné.

Indexace PDF dokumentu s pevnou strukturou pomocou OCR

Název práce v češtině:	Indexace PDF dokumentu s pevnou strukturou pomocou OCR
Název v anglickém jazyce:	Using OCR to index PDF documents with predefined structure
Akademický rok vypsání:	2008/2009
Typ práce:	bakalářská práce
Jazyk práce:
Ústav:	Katedra softwarového inženýrství (32-KSI)
Vedoucí / školitel:	RNDr. Jozef Mišutka, Ph.D.
Řešitel:

Zásady pro vypracování

Student navrhne a rozsiri stavajici vyhledavac pro pdf dokumenty konvertovane do textovej podoby za pouziti OCR. Tento vyhledavac musi zobrazovat a vyhledavat v specialni strukuturovanych dokumentoch napr. bakalarskych/diplomovych praci. Soucasti prace je import casti existujicich bakalarskych/diplomovych praci.

Seznam odborné literatury

[1] The PDF Reference, http://partners.adobe.com/public/developer/en/pdf/PDFReference.pdf
[2] A review of free optical character recognition software, http://groundstate.ca/ocr
[3] Egothor - java search engine, http://www.egothor.org/

Předběžná náplň práce

Cilem prace je spristupnit bakalarske/diplomove prace poskytnute v pdf formate s moznosti vyhledavani v nich.

Předběžná náplň práce v anglickém jazyce

The aim of this work is to provide access and searching capabilities to Bc. & Msc. theses.