Indexace elektronických dokumentů a jejich částí
Název práce v češtině: | Indexace elektronických dokumentů a jejich částí |
---|---|
Název v anglickém jazyce: | Indexing of text documents and their parts |
Klíčová slova: | Elektronické dokumenty, sumarizace textů, tvorba navigační struktury, indexace, HTML |
Klíčová slova anglicky: | electronic documents, text summarization, enhanced navigation structure, indexing, HTML |
Akademický rok vypsání: | 2013/2014 |
Typ práce: | diplomová práce |
Jazyk práce: | čeština |
Ústav: | Katedra softwarového inženýrství (32-KSI) |
Vedoucí / školitel: | RNDr. Michal Kopecký, Ph.D. |
Řešitel: | skrytý - zadáno a potvrzeno stud. odd. |
Datum přihlášení: | 30.10.2013 |
Datum zadání: | 08.11.2013 |
Datum potvrzení stud. oddělením: | 18.11.2013 |
Datum a čas obhajoby: | 09.09.2015 09:00 |
Datum odevzdání elektronické podoby: | 05.05.2015 |
Datum odevzdání tištěné podoby: | 31.07.2015 |
Datum proběhlé obhajoby: | 09.09.2015 |
Oponenti: | RNDr. Tomáš Grošup, Ph.D. |
Zásady pro vypracování |
Cílem práce je navrhnout a implementovat systém pro indexaci elektronických dokumentů (např. sborníků konferenčních příspěvků, elektronických publikací a podobně) a jejich částí - například kapitol, sekcí, či odstavců za účelem usnadnění navigace v těchto dokumentech a poskytování výňatků z nich. Jednotlivé algoritmy by měly být aplikovatelné na různých stupních granularity vstupních dat. Systém musí být navržen modulárně s dobře definovanými rozhraními tak, aby jej bylo možné v budoucnosti rozšiřovat o další alternativní algoritmy. |
Seznam odborné literatury |
[1] Radoslav Zápotocký: Shlukování textových dokumentů a jejich částí (Clustering of text documents and their parts), Diplomová práce MFF UK, 2011
[2] Christopher D. Manning, Prabhakar Raghavan and Hinrich Schütze: Introduction to Information Retrieval, Cambridge University Press. 2008 [3] Guojun Gan, Chaoqun Ma, Jianhong Wu: Data Clustering: Theory, Algorithms, and Applications, Cambridge, 2007 [4] Bjornar Larsen, Chinatsu Aone: Fast and effective text mining using linear-time document clustering, Proceedings of the fifth ACM SIGKDD international conference on Knowledge discovery and data mining, pp. 16 - 22, San Diego, 1999, ISBN:1-58113-143-7 |