Thesis (Selection of subject)Thesis (Selection of subject)(version: 368)
Thesis details
   Login via CAS
Přibližné spojování dat
Thesis title in thesis language (Slovak): Přibližné spojování dat
Thesis title in Czech:
Thesis title in English: Approximative join
Academic year of topic announcement: 2008/2009
Thesis type: Bachelor's thesis
Thesis language: slovenština
Department: Department of Software Engineering (32-KSI)
Supervisor: doc. Mgr. Martin Nečaský, Ph.D.
Author: hidden - assigned and confirmed by the Study Dept.
Date of registration: 16.03.2009
Date of assignment: 16.03.2009
Guidelines
Cílem práce je implementovat ETL komponentu v prostředí Clover firmy Javlin Consulting, která bude sloužit ke spojování dat na základě přibližné podobnosti, nikoli rovnosti. Existuje celá řada metrik na měření vzdálenosti řeťezců a zároveň jsou popsány algoritmy, jakým způsobem lze tento v naivním případě kvadratický problém řešit výrazně rychleji. Řešitel práce provede průzkum možných řešení a některá z nich implementuje pro potřeby přibližného spojování. Práce bude řešena v úzké spolupráci s firmou Javlin Consulting.
References
http://www.cloveretl.org
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html