Detekcia intenzity v postojovej analýze češtiny
Název práce v jazyce práce (slovenština): | Detekcia intenzity v postojovej analýze češtiny |
---|---|
Název práce v češtině: | Detekce intenzity v postojové analýze češtiny |
Název v anglickém jazyce: | Detection of Intensity in Sentiment Analysis of Czech |
Klíčová slova: | postojová analýza, strojové učení, počítačová lingvistika |
Klíčová slova anglicky: | sentiment analysis, machine learning, computational linguistics |
Akademický rok vypsání: | 2016/2017 |
Typ práce: | bakalářská práce |
Jazyk práce: | slovenština |
Ústav: | Ústav formální a aplikované lingvistiky (32-UFAL) |
Vedoucí / školitel: | Mgr. Aleš Tamchyna, Ph.D. |
Řešitel: | skrytý![]() |
Datum přihlášení: | 22.02.2017 |
Datum zadání: | 23.02.2017 |
Datum potvrzení stud. oddělením: | 27.02.2017 |
Datum a čas obhajoby: | 20.06.2017 00:00 |
Datum odevzdání elektronické podoby: | 17.05.2017 |
Datum odevzdání tištěné podoby: | 17.05.2017 |
Datum proběhlé obhajoby: | 20.06.2017 |
Oponenti: | RNDr. David Mareček, Ph.D. |
Zásady pro vypracování |
Postojová analýza obvykle rozlišuje pouze pozitivní a negativní (případně neutrální) segmenty. V mnoha případech je však žádoucí předpovědět také intenzitu postoje. Příkladem jsou recenze filmů, kde diváci hodnotí díla určitým počtem hvězdiček.
Předmětem práce je řešit tuto úlohu pomocí strojového učení. Prvním krokem je vytvoření datasetu diváckých hodnocení z veřejně dostupných zdrojů. Recenze mají obvykle vnitřní strukturu, kterou lze potenciálně v práci využít. K řešení se nabízí několik metod strojového učení: výhodou jednodušších modelů, např. logistické regrese, je možnost je poměrně snadno analyzovat. Modely založené na hlubokém učení (např. rekurentní nebo konvoluční neuronové sítě) potenciálně dokážou lépe pracovat s větnou strukturou a mohou tak dosáhnout lepších výsledků. Úkolem práce je implementovat a experimentálně porovnat několik možných metod. Práce se také pokusí analyzovat, jak se s intenzitou hodnocení (ať už pozitivní či negativní) mění užité jazykové prostředky. |
Seznam odborné literatury |
Kim, Yoon. Convolutional neural networks for sentence classification. arXiv preprint arXiv:1408.5882 (2014).
Narendra Gupta, Giuseppe Di Fabbrizio, and Patrick Haffner. 2010. Capturing the stars: predicting ratings for service and product reviews. In Proceedings of the NAACL HLT 2010 Workshop on Semantic Search (SS '10). Association for Computational Linguistics, Stroudsburg, PA, USA, 36-43. Veselovská Kateřina. On the Linguistic Structure of Emotional Meaning in Czech. Ph.D. thesis, Faculty of Mathematics and Physics, Charles University in Prague, Prague, Czech Republic, 190 pp., 2015. |