Zpřístupnění a správa naskenovaných dokumentů
Thesis title in Czech: | Zpřístupnění a správa naskenovaných dokumentů |
---|---|
Thesis title in English: | Accessing and Management of Scanned Documents |
Academic year of topic announcement: | 2007/2008 |
Thesis type: | Bachelor's thesis |
Thesis language: | čeština |
Department: | Department of Software Engineering (32-KSI) |
Supervisor: | RNDr. Michal Žemlička, Ph.D. |
Author: | hidden - assigned and confirmed by the Study Dept. |
Date of registration: | 15.11.2007 |
Date of assignment: | 15.11.2007 |
Date and time of defence: | 09.09.2008 00:00 |
Date of electronic submission: | 09.09.2008 |
Date of submission of printed version: | 09.09.2008 |
Date of proceeded defence: | 09.09.2008 |
Opponents: | PhDr. Petra Hoffmannová |
Guidelines |
Vytvořte aplikaci umožňující správu a poskytující přístup ke kolekci naskenovaných historických dokumentů. Aplikace by měla poskytovat nástroje jak na práci s obrázky, tak i s metadaty.
Zvažte podporu asistovaného převodu dokumentů do textu a případnou synchronní prezentaci naskenovaných i textových variant téhož dokumentu. Je třeba, aby rozhraní bylo dostupné i neinformatikům. |
References |
1. Mehdi Achour et al.: PHP Manuál. http://www.php.net/manual/cs/
2. MySQL AB: MySQL Reference Manual. http://dev.mysql.com/doc/ 3. Library of Congress: Marc 21 Specifications for Record Structure, Character Sets, and Exchange Media. 2000. http://www.loc.gov/marc/specifications/spechome.html |
Preliminary scope of work |
Cílem této práce je usnadnit přístup k hůře dostupným starším (typicky z XIX. a první poloviny XX. století) dokumentům. Tyto dokumenty jsou skenovány a jsou k nim doplňovány další údaje. Tato databáze pak je zpřístupněna přes web příslušným odborníkům (např. historkům). Kolekce naskenovaných dokumentů je poměrně rozsáhlá (desítky TB dat) a dále poroste. Správa i rozumná prezentace takovýchto dat jsou proto pro řešitele zajímavou výzvou. |
Preliminary scope of work in English |
Goal of this work is to simplify access to worse accessible historical (typically from XIX-th or from first half of XX-th century) documents. These documents are scanned and there are collected some additional data about the documents. This collection should be made accessible to its readers (e.g. historians). The collection is quite large (tens of TB) and will grow. Management and reasonable presentation of such data are therefore an interesting challenge for the solver. |