Clustrovací framework
Thesis title in Czech: | Clustrovací framework |
---|---|
Thesis title in English: | Clustering Framework |
Academic year of topic announcement: | 2005/2006 |
Thesis type: | Bachelor's thesis |
Thesis language: | angličtina |
Department: | Department of Software Engineering (32-KSI) |
Supervisor: | RNDr. Leo Galamboš, Ph.D. |
Author: | hidden - assigned and confirmed by the Study Dept. |
Date of registration: | 12.11.2005 |
Date of assignment: | 12.11.2005 |
Date and time of defence: | 26.06.2006 00:00 |
Date of electronic submission: | 26.06.2006 |
Date of submission of printed version: | 26.06.2006 |
Date of proceeded defence: | 26.06.2006 |
Opponents: | RNDr. Michal Žemlička, Ph.D. |
Guidelines |
Clusterovací stroje zpřehlednují dotazování do mnoha databazí. Jejich vstupem jsou (ne)organizovaná data, která jsou na výstupu organizována v přehledné formě.
Cílem této práce je navrhnout clustrovací stroj s otevřeným API, včetně pilotní implementace. Narozdíl od většiny existujících projektů bude nový framework podporovat i dodatečné váhové značky na vstupních datech. Práce zodpoví otázku, do jaké míry je rozšíření vstupu o váhové značky přínosné pro koncového uživatele (nad bází dokumentů v českém jazyce). |
References |
Ricardo Baeza-Yates, Berthier Ribeiro-Neto: Modern Information Retrieval. Addison Wesley, 1999.
Soumen Chakrabarti: Mining the Web: Discovering Knowledge from Hypertext Data. Amsterdam: Morgan Kaufmann, 2003. Vivisimo Platform: http://vivisimo.com Projekt Carrot2: http://carrot2.sf.net |