Extrakce znalostí z dat
Thesis title in thesis language (Slovak): | Extrakce znalostí z dat |
---|---|
Thesis title in Czech: | Extrakce znalostí z dat |
Thesis title in English: | Knowledge Extraction from Data |
Academic year of topic announcement: | 2008/2009 |
Thesis type: | diploma thesis |
Thesis language: | slovenština |
Department: | Department of Theoretical Computer Science and Mathematical Logic (32-KTIML) |
Supervisor: | doc. RNDr. Iveta Mrázová, CSc. |
Author: | hidden - assigned and confirmed by the Study Dept. |
Date of registration: | 28.11.2008 |
Date of assignment: | 28.11.2008 |
Date and time of defence: | 07.09.2009 00:00 |
Date of electronic submission: | 07.09.2009 |
Date of proceeded defence: | 07.09.2009 |
Opponents: | RNDr. Mgr. Zuzana Petříčková, Ph.D. |
Guidelines |
V diplomové práci posluchač přehledově zpracuje následující témata:
-rekapitulace metod použitelných pro analýzu nákupního košíku a jejich analýza (asociační pravidla a jejich generování, algoritmus apriori, základní charakteristiky pravidel, taxonomie použitých atributů) - rekapitulace a vzájemné porovnání různých modelů rozhodovacích stromů (např. CART, C4.5, CHAID) - rekapitulace a vzájemné porovnání základních technik vhodných k extrakci použitelných pravidel - prořezávání vytvářených stromů, pravidel i atributů, míra zajímavosti nalezených pravidel - interpretace a vizualizace extrahovaných znalostí a pravidel Na některé z uvedených témat se diplomant zaměří detailněji a na základě reálných ekonomických dat navrhne vhodnou strategii pro předzpracování vstupních dat a přistoupí k implementaci jednotlivých modelů. Součástí práce bude i zhodnocení vlastních výsledků a zkušeností. |
References |
1. Některé z dostupných základních učebnic vhodných pro zvolené téma, např.:
- M. Berry, G. Linoff: Data Mining Techniques For Marketing, Sales, and Customer Support, John Wiley & Sons, 1997 - T. M. Mitchell: Machine Learning, McGraw-Hill, New York, 1997 - D. Pyle: Business Modeling and Data Mining, Morgan Kaufmann Press, 2003 - I. H. Witten, F. Eibe: Data Mining, Practical Machine Learning Tools and Techniques with Java Implementation, Morgan Kaufmann Publishers, San Francisco, 2000 2. Články: - R. Agrawal, T. Imielinski, A. N. Swami: Mining Association Rules between Sets of Items in Large Databases, in: Proc. of the ACM SIGMOD Int. Conf. on Management of Data, pp. 207-216, 1993 - J. R. Quinlan: Induction of decision trees, in: Machine learning, vol. 1, pp.81-106, 1986 - B. Liu, W. Hsu, Y. Ma: Pruning and Summarizing the Discovered Associations, in: Proc. of the ACM SIGKDD Int. Conf. on Knowledge Discovery and Data Mining (KDD´99), pp. 125-134, 1999 - B. Liu, K. Zhao, J. Benkler and W. Xiao: Rule interestingness Analysis Using OLAP Operations, in: Proc. of the Twelfth ACM SIGKDD Int. Conf. on Knowledge Discovery and Data Mining (KDD´06), pp. 297-306, 2006 3. Aktuální články z profilujících světových časopisů, např.: Data Mining and Knowledge Discovery, IEEE Transactions on Knowledge and Data Engineering ap. |