Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Data Mining Techniques and their Application to Sentiment Analysis
Název práce v češtině: Metody dobývání znalostí a jejich využití při analýze sentimentu
Název v anglickém jazyce: Data Mining Techniques and their Application to Sentiment Analysis
Klíčová slova: dobývání znalostí, analýza sentimentu, klastrování, klasifikace, asociační pravidla, sociální sítě
Klíčová slova anglicky: data mining, sentiment analysis, clustering, classification, associacion rules, social networks
Akademický rok vypsání: 2016/2017
Typ práce: diplomová práce
Jazyk práce: angličtina
Ústav: Katedra teoretické informatiky a matematické logiky (32-KTIML)
Vedoucí / školitel: doc. RNDr. Iveta Mrázová, CSc.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 25.11.2016
Datum zadání: 25.11.2016
Datum potvrzení stud. oddělením: 01.12.2016
Zásady pro vypracování
The student shall review the following topics in his diploma thesis:

- recapitulation and mutual comparison of data mining techniques suitable for (pre)processing of textual data (e.g., feature selection, dimension reduction, clustering, etc.)

- overview and comparison of various paradigms applicable to classification of textual data (e.g., SVM-machines and artificial neural networks)

- detection of characteristic input pattern features and influential individuals (involving various data mining techniques, also, e.g., from the area of social network analysis like PageRank, HITS)

The student will focus on some of these topics in more detail. Further, he will propose a suitable strategy for textual data processing based on real-world data (e.g., for sentiment analysis based on the data available from the BMW partner website, yelp.com, TripAdvisor.com or Booking.com website) and shall implement the models. The evaluation of the obtained results and gained experience shall form an important part of the thesis.
Seznam odborné literatury
Seznam doporučené literatury:

1. Některé z dostupných základních učebnic, resp. přehledových článků vhodných pro zvolené téma, např.:
- C. C. Aggarwal (Ed.): Social Network Data Analytics, Springer, (2011).
- M. W. Berry (Ed.): Survey of Text Mining: Clustering, Classification, and Retrieval, Springer, (2004).
- S. Chakrabarti: Mining the Web: Discovering Knowledge from Hypertext Data, Morgan Kaufmann, (2003).
- B. Liu: Web Data Mining: Exploring Hyperlinks, Contents, and Usage Data, Springer, (2007).

2. Články:
- S. Brin, L. Page: The Anatomy of a Large-Scale Hypertextual Web Search Engine, in: Computer Networks, Vol. 30 (1-7), (1998), pp. 107-117.
- M. Cosciaa, F. Giannotti, D. Pedreschia: A Classification for Community Discovery Methods in Complex Networks, in: the Statistical Analysis and Data Mining journal, Special Issue: Networks, Vol. 4, No. 5, (2011), pp. 512-546.
- G. W. Flake, S. Lawrence, C. L. Giles and F. Coetzee: Self-Organization of the Web and Identification of Communities, in: IEEE Computer, Vol. 35(3), (2002), pp. 61-71.
- A. Goyal, F. Bonchi, and L. V. Lakshmanan: Discovering leaders from community actions, in: Proc. of CIKM 2008, (2008), pp. 499-508.
- S. Gregory: An Algorithm to Find Overlapping Community Structure in Networks, in: Proc. of PKDD´07 (LNCS 4702), (2007), pp. 91-102.
- J. Kleinberg: Authoritative Sources in a Hyperlinked Environment, in: Journal of the ACM, Vol. 46 (5), (1999), pp. 604-632.
- T. Phienthrakul, B. Kijsirikul, H. Takamura, M. Okumura: Sentiment Classification with Support Vector Machines and Multiple Kernel Functions, in: Neural Information Processing (Proc. of ICONIP 2009), LNCS (5864), (2009), pp. 583-592.
- C. dos Santos, M. Gatti: Deep Convolutional Neural Networks for Sentiment Analysis of Short Texts, in: Proc of COLING 2014, Dublin City University and Association for Computational Linguistics, (2014), pp. 69-78.

3. Aktuální články z profilujících světových časopisů, např.:
Data Mining and Knowledge Discovery, IEEE Transactions on Knowledge and Data Engineering, Machine Learning ap.
 
Univerzita Karlova | Informační systém UK