Témata prací (Výběr práce)

Váš prohlížeč nepodporuje JavaScript nebo je jeho podpora vypnutá. Některé funkce nemusejí být dostupné.

Clustrovací framework

Název práce v češtině:	Clustrovací framework
Název v anglickém jazyce:	Clustering Framework
Akademický rok vypsání:	2005/2006
Typ práce:	bakalářská práce
Jazyk práce:	angličtina
Ústav:	Katedra softwarového inženýrství (32-KSI)
Vedoucí / školitel:	RNDr. Leo Galamboš, Ph.D.
Řešitel:	skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení:	12.11.2005
Datum zadání:	12.11.2005
Datum a čas obhajoby:	26.06.2006 00:00
Datum odevzdání elektronické podoby:	26.06.2006
Datum odevzdání tištěné podoby:	26.06.2006
Datum proběhlé obhajoby:	26.06.2006
Oponenti:	RNDr. Michal Žemlička, Ph.D.

Zásady pro vypracování

Clusterovací stroje zpřehlednují dotazování do mnoha databazí. Jejich vstupem jsou (ne)organizovaná data, která jsou na výstupu organizována v přehledné formě.

Cílem této práce je navrhnout clustrovací stroj s otevřeným API, včetně pilotní implementace. Narozdíl od většiny existujících projektů bude nový framework podporovat i dodatečné váhové značky na vstupních datech.

Práce zodpoví otázku, do jaké míry je rozšíření vstupu o váhové značky přínosné pro koncového uživatele (nad bází dokumentů v českém jazyce).

Seznam odborné literatury

Ricardo Baeza-Yates, Berthier Ribeiro-Neto: Modern Information Retrieval. Addison Wesley, 1999.
Soumen Chakrabarti: Mining the Web: Discovering Knowledge from Hypertext Data. Amsterdam: Morgan Kaufmann, 2003.
Vivisimo Platform: http://vivisimo.com
Projekt Carrot2: http://carrot2.sf.net