Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 385)
Detail práce
   Přihlásit přes CAS
Text mining in social network analysis
Název práce v češtině: Dobývání znalostí z textů při analýze sociálních sítí
Název v anglickém jazyce: Text mining in social network analysis
Klíčová slova: dolovanie dát, sociálne siete, klastrovanie, neurónové siete, hodnotiace algoritmy, CUDA
Klíčová slova anglicky: data mining, social networks, clustering, neural networks, ranking algorithms, CUDA
Akademický rok vypsání: 2014/2015
Typ práce: diplomová práce
Jazyk práce: angličtina
Ústav: Katedra teoretické informatiky a matematické logiky (32-KTIML)
Vedoucí / školitel: doc. RNDr. Iveta Mrázová, CSc.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 08.04.2015
Datum zadání: 14.04.2015
Datum potvrzení stud. oddělením: 22.04.2015
Datum a čas obhajoby: 29.01.2018 00:00
Datum odevzdání elektronické podoby:03.01.2018
Datum odevzdání tištěné podoby:04.01.2018
Datum proběhlé obhajoby: 29.01.2018
Oponenti: Mgr. Klára Pešková, Ph.D.
 
 
 
Konzultanti: RNDr. Peter Zvirinský, Ph.D.
Zásady pro vypracování
The student shall review the following topics in his diploma thesis:

- overview and comparison of various paradigms applicable to text mining and social network analysis (data pre-processing techniques, feature selection, clustering and classification, among others)

- recapitulation and mutual comparison of known techniques suitable for the detection of influential individuals and determination of their position, role and impact in the found community (PageRank, HITS, clustering and probabilistic network evolution models)

- interpretation of the obtained results and visualization of the extracted knowledge

The student will focus on some of these topics in more detail. Further, he will propose a suitable strategy for processing of textual data from social networks based on real-world data (available, e.g., from the Enron email corpus) and shall implement the models. The evaluation of the obtained results and gained experience shall form an important part of the thesis.
Seznam odborné literatury
Seznam doporučené literatury:

1. Některé z dostupných základních učebnic, resp. přehledových článků vhodných pro zvolené téma, např.:
- C. C. Aggarwal (Ed.): Social Network Data Analytics, Springer, (2011).
- M. W. Berry (Ed.): Survey of Text Mining: Clustering, Classification, and Retrieval, Springer, (2004).
- S. Chakrabarti: Mining the Web: Discovering Knowledge from Hypertext Data, Morgan Kaufmann, (2003).
- B. Liu: Web Data Mining: Exploring Hyperlinks, Contents, and Usage Data, Springer, (2007).

2. Články:
- R. Amarasiri, D. Alahakoon, K. Smith-Miles: Clustering massive high dimensional data with dynamic feature maps, in: Neural Information Processing (Proc. of ICONIP 2006), LNCS (4233), (2006), pp. 814-823.
- S. Brin, L. Page: The Anatomy of a Large-Scale Hypertextual Web Search Engine, in: Computer Networks, Vol. 30 (1-7), (1998), pp. 107-117.
- M. Cosciaa, F. Giannotti, D. Pedreschia: A Classification for Community Discovery Methods in Complex Networks, in: the Statistical Analysis and Data Mining journal, Special Issue: Networks, Vol. 4, No. 5, (2011), pp. 512-546.
- G. W. Flake, S. Lawrence, C. L. Giles and F. Coetzee: Self-Organization of the Web and Identification of Communities, in: IEEE Computer, Vol. 35(3), (2002), pp. 61-71.
- A. Goyal, F. Bonchi, and L. V. Lakshmanan: Discovering leaders from community actions, in: Proc. of CIKM 2008, (2008), pp. 499-508.
- S. Gregory: An Algorithm to Find Overlapping Community Structure in Networks, in: Proc. of PKDD´07 (LNCS 4702), (2007), pp. 91-102.
- J. Kleinberg: Authoritative Sources in a Hyperlinked Environment, in: Journal of the ACM, Vol. 46 (5), (1999), pp. 604-632.
- X. Li, B. Liu, P. S. Yu: Discovering Overlapping Communities of Named Entities, in: Proc. of PKDD´06 (LNCS 4213), (2006), pp. 593-600.
- G. Wilson, W. Banzhaf: Discovery of Email Communication Networks from the Enron Corpus with a Genetic Algorithm using Social Network Analysis, in: Proc. of CEC´09, (2009), pp. 3256 - 3263.

3. Aktuální články z profilujících světových časopisů, např.:
Data Mining and Knowledge Discovery, IEEE Transactions on Knowledge and Data Engineering, Machine Learning ap.
 
Univerzita Karlova | Informační systém UK