Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Clustrovací framework
Název práce v češtině: Clustrovací framework
Název v anglickém jazyce: Clustering Framework
Akademický rok vypsání: 2005/2006
Typ práce: bakalářská práce
Jazyk práce: angličtina
Ústav: Katedra softwarového inženýrství (32-KSI)
Vedoucí / školitel: RNDr. Leo Galamboš, Ph.D.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 12.11.2005
Datum zadání: 12.11.2005
Datum a čas obhajoby: 26.06.2006 00:00
Datum odevzdání elektronické podoby:26.06.2006
Datum odevzdání tištěné podoby:26.06.2006
Datum proběhlé obhajoby: 26.06.2006
Oponenti: RNDr. Michal Žemlička, Ph.D.
 
 
 
Zásady pro vypracování
Clusterovací stroje zpřehlednují dotazování do mnoha databazí. Jejich vstupem jsou (ne)organizovaná data, která jsou na výstupu organizována v přehledné formě.

Cílem této práce je navrhnout clustrovací stroj s otevřeným API, včetně pilotní implementace. Narozdíl od většiny existujících projektů bude nový framework podporovat i dodatečné váhové značky na vstupních datech.

Práce zodpoví otázku, do jaké míry je rozšíření vstupu o váhové značky přínosné pro koncového uživatele (nad bází dokumentů v českém jazyce).
Seznam odborné literatury
Ricardo Baeza-Yates, Berthier Ribeiro-Neto: Modern Information Retrieval. Addison Wesley, 1999.
Soumen Chakrabarti: Mining the Web: Discovering Knowledge from Hypertext Data. Amsterdam: Morgan Kaufmann, 2003.
Vivisimo Platform: http://vivisimo.com
Projekt Carrot2: http://carrot2.sf.net
 
Univerzita Karlova | Informační systém UK