Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Indexace PDF dokumentu s pevnou strukturou pomocou OCR
Název práce v češtině: Indexace PDF dokumentu s pevnou strukturou pomocou OCR
Název v anglickém jazyce: Using OCR to index PDF documents with predefined structure
Akademický rok vypsání: 2008/2009
Typ práce: bakalářská práce
Jazyk práce:
Ústav: Katedra softwarového inženýrství (32-KSI)
Vedoucí / školitel: RNDr. Jozef Mišutka, Ph.D.
Řešitel:
Zásady pro vypracování
Student navrhne a rozsiri stavajici vyhledavac pro pdf dokumenty konvertovane do textovej podoby za pouziti OCR. Tento vyhledavac musi zobrazovat a vyhledavat v specialni strukuturovanych dokumentoch napr. bakalarskych/diplomovych praci. Soucasti prace je import casti existujicich bakalarskych/diplomovych praci.
Seznam odborné literatury
[1] The PDF Reference, http://partners.adobe.com/public/developer/en/pdf/PDFReference.pdf
[2] A review of free optical character recognition software, http://groundstate.ca/ocr
[3] Egothor - java search engine, http://www.egothor.org/
Předběžná náplň práce
Cilem prace je spristupnit bakalarske/diplomove prace poskytnute v pdf formate s moznosti vyhledavani v nich.
Předběžná náplň práce v anglickém jazyce
The aim of this work is to provide access and searching capabilities to Bc. & Msc. theses.
 
Univerzita Karlova | Informační systém UK