Thesis (Selection of subject)Thesis (Selection of subject)(version: 368)
Thesis details
   Login via CAS
Clustrovací framework
Thesis title in Czech: Clustrovací framework
Thesis title in English: Clustering Framework
Academic year of topic announcement: 2005/2006
Thesis type: Bachelor's thesis
Thesis language: angličtina
Department: Department of Software Engineering (32-KSI)
Supervisor: RNDr. Leo Galamboš, Ph.D.
Author: hidden - assigned and confirmed by the Study Dept.
Date of registration: 12.11.2005
Date of assignment: 12.11.2005
Date and time of defence: 26.06.2006 00:00
Date of electronic submission:26.06.2006
Date of submission of printed version:26.06.2006
Date of proceeded defence: 26.06.2006
Opponents: RNDr. Michal Žemlička, Ph.D.
 
 
 
Guidelines
Clusterovací stroje zpřehlednují dotazování do mnoha databazí. Jejich vstupem jsou (ne)organizovaná data, která jsou na výstupu organizována v přehledné formě.

Cílem této práce je navrhnout clustrovací stroj s otevřeným API, včetně pilotní implementace. Narozdíl od většiny existujících projektů bude nový framework podporovat i dodatečné váhové značky na vstupních datech.

Práce zodpoví otázku, do jaké míry je rozšíření vstupu o váhové značky přínosné pro koncového uživatele (nad bází dokumentů v českém jazyce).
References
Ricardo Baeza-Yates, Berthier Ribeiro-Neto: Modern Information Retrieval. Addison Wesley, 1999.
Soumen Chakrabarti: Mining the Web: Discovering Knowledge from Hypertext Data. Amsterdam: Morgan Kaufmann, 2003.
Vivisimo Platform: http://vivisimo.com
Projekt Carrot2: http://carrot2.sf.net
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html