Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Indexace elektronických dokumentů a jejich částí
Název práce v češtině: Indexace elektronických dokumentů a jejich částí
Název v anglickém jazyce: Indexing of text documents and their parts
Klíčová slova: Elektronické dokumenty, sumarizace textů, tvorba navigační struktury, indexace, HTML
Klíčová slova anglicky: electronic documents, text summarization, enhanced navigation structure, indexing, HTML
Akademický rok vypsání: 2013/2014
Typ práce: diplomová práce
Jazyk práce: čeština
Ústav: Katedra softwarového inženýrství (32-KSI)
Vedoucí / školitel: RNDr. Michal Kopecký, Ph.D.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 30.10.2013
Datum zadání: 08.11.2013
Datum potvrzení stud. oddělením: 18.11.2013
Datum a čas obhajoby: 09.09.2015 09:00
Datum odevzdání elektronické podoby:05.05.2015
Datum odevzdání tištěné podoby:31.07.2015
Datum proběhlé obhajoby: 09.09.2015
Oponenti: RNDr. Tomáš Grošup, Ph.D.
 
 
 
Zásady pro vypracování
Cílem práce je navrhnout a implementovat systém pro indexaci elektronických dokumentů (např. sborníků konferenčních příspěvků, elektronických publikací a podobně) a jejich částí - například kapitol, sekcí, či odstavců za účelem usnadnění navigace v těchto dokumentech a poskytování výňatků z nich. Jednotlivé algoritmy by měly být aplikovatelné na různých stupních granularity vstupních dat. Systém musí být navržen modulárně s dobře definovanými rozhraními tak, aby jej bylo možné v budoucnosti rozšiřovat o další alternativní algoritmy.
Seznam odborné literatury
[1] Radoslav Zápotocký: Shlukování textových dokumentů a jejich částí (Clustering of text documents and their parts), Diplomová práce MFF UK, 2011
[2] Christopher D. Manning, Prabhakar Raghavan and Hinrich Schütze: Introduction to Information Retrieval, Cambridge University Press. 2008
[3] Guojun Gan, Chaoqun Ma, Jianhong Wu: Data Clustering: Theory, Algorithms, and Applications, Cambridge, 2007
[4] Bjornar Larsen, Chinatsu Aone: Fast and effective text mining using linear-time document clustering, Proceedings of the fifth ACM SIGKDD international conference on Knowledge discovery and data mining, pp. 16 - 22, San Diego, 1999, ISBN:1-58113-143-7
 
Univerzita Karlova | Informační systém UK