Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Shlukování textových dokumentů
Název práce v češtině: Shlukování textových dokumentů
Název v anglickém jazyce: Dokument clustering
Akademický rok vypsání: 2006/2007
Typ práce: diplomová práce
Jazyk práce: čeština
Ústav: Katedra softwarového inženýrství (32-KSI)
Vedoucí / školitel: RNDr. Michal Kopecký, Ph.D.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 07.11.2006
Datum zadání: 07.11.2006
Datum a čas obhajoby: 24.09.2008 00:00
Datum odevzdání elektronické podoby:24.09.2008
Datum proběhlé obhajoby: 24.09.2008
Oponenti: RNDr. Leo Galamboš, Ph.D.
 
 
 
Zásady pro vypracování
Cílem této práce je navrhnout a implementovat otevřený a rozšiřitelný systém pro shlukování dokumentů a jejich značkování pomocí charakteristických termů.
Primárním cílem je umožnit uživateli snadnou orientaci v dokumentech, uložených off-line na lokálním disku počítače, vytváření skupin podobných dokumentů a navigace mezi nimi.
Na řešiteli je zvážení, zda výsledný modul začlenit do již existujícího vyhledávače (např. Egothor), či zvolit nějaké jiné řešení.
Seznam odborné literatury
[1] Cetkovský M., Clustering Framework, Bachelor thesis, MFF UK, 2006
[2] Pokorný J., Snášel V., Kopecký M.: Dokumentografické informační systémy, Nakladatelství Karolinum, UK Praha, 2005
[3] Inderjit S. Dhillon, Dharmendra S. Modha: Concept Decomposition �for Large Sparse Text Data using Clustering, IBM Almaden Research Center, 1999
[4] http://www.egothor.org
 
Univerzita Karlova | Informační systém UK