Shlukování textových dokumentů
Název práce v češtině: | Shlukování textových dokumentů |
---|---|
Název v anglickém jazyce: | Dokument clustering |
Akademický rok vypsání: | 2006/2007 |
Typ práce: | diplomová práce |
Jazyk práce: | čeština |
Ústav: | Katedra softwarového inženýrství (32-KSI) |
Vedoucí / školitel: | RNDr. Michal Kopecký, Ph.D. |
Řešitel: | skrytý - zadáno a potvrzeno stud. odd. |
Datum přihlášení: | 07.11.2006 |
Datum zadání: | 07.11.2006 |
Datum a čas obhajoby: | 24.09.2008 00:00 |
Datum odevzdání elektronické podoby: | 24.09.2008 |
Datum proběhlé obhajoby: | 24.09.2008 |
Oponenti: | RNDr. Leo Galamboš, Ph.D. |
Zásady pro vypracování |
Cílem této práce je navrhnout a implementovat otevřený a rozšiřitelný systém pro shlukování dokumentů a jejich značkování pomocí charakteristických termů.
Primárním cílem je umožnit uživateli snadnou orientaci v dokumentech, uložených off-line na lokálním disku počítače, vytváření skupin podobných dokumentů a navigace mezi nimi. Na řešiteli je zvážení, zda výsledný modul začlenit do již existujícího vyhledávače (např. Egothor), či zvolit nějaké jiné řešení. |
Seznam odborné literatury |
[1] Cetkovský M., Clustering Framework, Bachelor thesis, MFF UK, 2006
[2] Pokorný J., Snášel V., Kopecký M.: Dokumentografické informační systémy, Nakladatelství Karolinum, UK Praha, 2005 [3] Inderjit S. Dhillon, Dharmendra S. Modha: Concept Decomposition �for Large Sparse Text Data using Clustering, IBM Almaden Research Center, 1999 [4] http://www.egothor.org |