Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Social networks and data mining
Název práce v češtině: Sociální sítě a dobývání znalostí
Název v anglickém jazyce: Social networks and data mining
Klíčová slova: sociální sítě, dobývání znalostí, předzpracování dat, extrakce znalostí, klasifikace
Klíčová slova anglicky: social networks, data mining, data pre-processing, knowledge extraction, classification
Akademický rok vypsání: 2012/2013
Typ práce: diplomová práce
Jazyk práce: angličtina
Ústav: Katedra teoretické informatiky a matematické logiky (32-KTIML)
Vedoucí / školitel: doc. RNDr. Iveta Mrázová, CSc.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 03.05.2013
Datum zadání: 15.05.2013
Datum potvrzení stud. oddělením: 28.06.2013
Datum a čas obhajoby: 26.05.2014 00:00
Datum odevzdání elektronické podoby:10.04.2014
Datum odevzdání tištěné podoby:11.04.2014
Datum proběhlé obhajoby: 26.05.2014
Oponenti: Mgr. Roman Neruda, CSc.
 
 
 
Zásady pro vypracování
The student shall review the following topics in his diploma thesis:
- overview and comparison of various paradigms applicable to data mining and social network analysis
(data pre-processing techniques, feature extraction, clustering, classification and rule extraction,
among others)
- recapitulation and mutual comparison of known techniques suitable for the detection of influential
individuals and determination of their position, role and impact in the found community (PageRank,
HITS, clustering and block methods - CONCOR, BURT, etc.)
- interpretation and visualization of the extracted knowledge

The student will focus on some of these topics in more detail. Further, he will propose a suitable
strategy for the analysis of social networks based on real-world data (most probably from the Czech
Insolvency Register) and he shall implement the models. The evaluation of the obtained results and
gained experience shall form an important part of the thesis.
Seznam odborné literatury
Seznam doporučené literatury:

1. Některé z dostupných základních učebnic, resp. přehledových článků vhodných pro zvolené téma, např.:
- B. Liu: Web Data Mining: Exploring Hyperlinks, Contents, and Usage Data, Springer, (2007).
- S. Chakrabarti: Mining the Web: Discovering Knowledge from Hypertext Data, Morgan Kaufmann, (2003).
- P. Berka: Dobývání znalostí z databází, Academia, (2003).

2. Články:
- S. Brin and L. Page: The Anatomy of a Large-Scale Hypertextual Web Search Engine, in: Computer Networks, Vol. 30 (1-7), (1998), pp. 107-117.
- R. S. Burt: Models of Network Structure, in: Annual Review of Sociology, Vol 6, (1980).
- P. Doreian, V. Batagelj, A. Ferligoj: Positional Analyses of Sociometric Data, in: P. J. Carrington, J. Scott, S. Wassermann: Models and Methods in Social Network Analysis, Cambridge University Press, (2005) pp. 77-97.
- K.-L. Du: Clustering: A neural network approach, in: Neural Networks, Vol. 23 (2009) pp. 89-107.
- G. W. Flake, S. Lawrence, C. L. Giles and F. Coetzee: Self-Organization of the Web and Identification of Communities, in: IEEE Computer, Vol. 35(3), (2002), pp. 61-71.
- J. Kleinberg: Authoritative Sources in a Hyperlinked Environment, in: Journal of the ACM, Vol. 46 (5), (1999), pp. 604-632.
- X. Li, B. Liu and P. S. Yu: Discovering Overlapping Communities of Named Entities, in: Proc. of PKDD´06, 2006.
- J. E. Schwartz: An Examination of CONCOR and Related Methods for Blocking Sociometric Data, in: D. Heise (Ed.), Sociological Methodology, Jossey-Bass, San Franscisco (1977).
- P. S. Yu, X. Li and B. Liu: Adding the Temporal Dimension to Search - A Case Study in Publication Search, in: Proc. of Web Intelligence (WI´05), (2005), pp. 543-549.

3. Aktuální články z profilujících světových časopisů, např.:
Data Mining and Knowledge Discovery, IEEE Transactions on Knowledge and Data Engineering, Machine Learning ap.
 
Univerzita Karlova | Informační systém UK