Thesis (Selection of subject)Thesis (Selection of subject)(version: 368)
Thesis details
   Login via CAS
Extrakce znalostí z dat
Thesis title in thesis language (Slovak): Extrakce znalostí z dat
Thesis title in Czech: Extrakce znalostí z dat
Thesis title in English: Knowledge Extraction from Data
Academic year of topic announcement: 2008/2009
Thesis type: diploma thesis
Thesis language: slovenština
Department: Department of Theoretical Computer Science and Mathematical Logic (32-KTIML)
Supervisor: doc. RNDr. Iveta Mrázová, CSc.
Author: hidden - assigned and confirmed by the Study Dept.
Date of registration: 28.11.2008
Date of assignment: 28.11.2008
Date and time of defence: 07.09.2009 00:00
Date of electronic submission:07.09.2009
Date of proceeded defence: 07.09.2009
Opponents: RNDr. Mgr. Zuzana Petříčková, Ph.D.
 
 
 
Guidelines
V diplomové práci posluchač přehledově zpracuje následující témata:

-rekapitulace metod použitelných pro analýzu nákupního košíku a jejich analýza (asociační pravidla a jejich generování, algoritmus apriori, základní charakteristiky pravidel, taxonomie použitých atributů)

- rekapitulace a vzájemné porovnání různých modelů rozhodovacích stromů (např. CART, C4.5, CHAID)

- rekapitulace a vzájemné porovnání základních technik vhodných k extrakci použitelných pravidel - prořezávání vytvářených stromů, pravidel i atributů, míra zajímavosti nalezených pravidel

- interpretace a vizualizace extrahovaných znalostí a pravidel

Na některé z uvedených témat se diplomant zaměří detailněji a na základě reálných ekonomických dat navrhne vhodnou strategii pro předzpracování vstupních dat a přistoupí k implementaci jednotlivých modelů. Součástí práce bude i zhodnocení vlastních výsledků a zkušeností.
References
1. Některé z dostupných základních učebnic vhodných pro zvolené téma, např.:
- M. Berry, G. Linoff: Data Mining Techniques For Marketing, Sales, and Customer Support, John Wiley & Sons, 1997
- T. M. Mitchell: Machine Learning, McGraw-Hill, New York, 1997
- D. Pyle: Business Modeling and Data Mining, Morgan Kaufmann Press, 2003
- I. H. Witten, F. Eibe: Data Mining, Practical Machine Learning Tools and Techniques with Java Implementation, Morgan Kaufmann Publishers, San Francisco, 2000

2. Články:
- R. Agrawal, T. Imielinski, A. N. Swami: Mining Association Rules between Sets of Items in Large Databases, in: Proc. of the ACM SIGMOD Int. Conf. on Management of Data, pp. 207-216, 1993
- J. R. Quinlan: Induction of decision trees, in: Machine learning, vol. 1, pp.81-106, 1986
- B. Liu, W. Hsu, Y. Ma: Pruning and Summarizing the Discovered Associations, in: Proc. of the ACM SIGKDD Int. Conf. on Knowledge Discovery and Data Mining (KDD´99), pp. 125-134, 1999
- B. Liu, K. Zhao, J. Benkler and W. Xiao: Rule interestingness Analysis Using OLAP Operations, in: Proc. of the Twelfth ACM SIGKDD Int. Conf. on Knowledge Discovery and Data Mining (KDD´06), pp. 297-306, 2006

3. Aktuální články z profilujících světových časopisů, např.: Data Mining and Knowledge Discovery, IEEE Transactions on Knowledge and Data Engineering ap.
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html