text size

Využití syntaktické informace pro identifikaci hodnocených entit

Notice: I hereby declare that I am aware that the information acquired from theses published by Charles University may not be used for commercial purposes or may not be published for educational, scientific or other creative activities as activities of person other than the author.
Title:
Využití syntaktické informace pro identifikaci hodnocených entit
Titile (in english):
Using Syntactic Features for Opinion Target Identification
Type:
Diploma thesis
Author:
Bc. Vladan Glončák
Supervisor:
Mgr. Jan Hajič
Opponent:
Mgr. Jindřich Helcl
Consultant:
Mgr. Kateřina Veselovská
Thesis Id:
213860
Faculty:
Faculty of Mathematics and Physics (MFF)
Department:
Institute of Formal and Applied Linguistics (32-UFAL)
Study programm:
Computer Science (N1801)
Study branch:
Computational Linguistics (IML)
Degree granted:
Mgr.
Defence date:
09/09/2019
Defence result:
Very good
Language:
English
Keywords (in czech):
Identifikace hodnocených entit, analýza sentimentu, syntax, Universal Dependencies, strojové učení
Keywords:
Opinion Target Identification, Sentiment Analysis, Syntax, Universal Dependencies, Machine Learning
Abstract (in czech):
Identifikace hodnocených entit (Opinion Target Extraction, OTE) je zavedená pod-úloha analýzy sentimentu. Zatímco detekce subjektivních výroků a určení jejich polarity (pozitivní, nebo negativní) je samo o sobě užitečné, schopnost identifikovat i tyto „cílové“ entity poskytuje mnohem kvalitnější podklady pro rozhodování: majitelka restaurace potřebuje vědět, jestli si hosté stěžují na obsluhu, jídlo, atmosféru, či další aspekty jejího podniku, atp. Ačkoliv tato úloha má stále silnou lexikální složku, je zde i velký potenciál využít obecných syntaktických konstrukcí v evaluativních výrocích: v jedné větě například může být potenciálních cílových entit více, a přiřazení správného cíle k hodnotícímu výroku tak je záležitostí správného rozlišení v syntaktické struktuře věty. Syntaktické vzorce spojené s evlauativními výroky již byly popsány. Tato diplomová práce si klade za cíl zkoumat, jak přítomnost syntaktické informace ovlivňuje na úloze extrakce cílových entit (OTE) chování state-of-the-art modelů strojového učení, jako například rekurentních neuronových sítí. Nepodařilo se nám najít žádné přesvědčivé důkazy, které by nasvědčovaly, že přítomnost syntaktické informace výrazně ovlivňuje chování zvolených modelů.
Abstract:
Opinion Target Extraction (OTE) is a well-established subtask of sentiment analysis. While detecting sentiment polarity is useful in itself, the ability to extract the targets of the opinions allows for more thorough decision making. For example, an owner of a restaurant needs to know whether the guests are complaining about the food, or the ambience, or any other aspect of their establishment, etc. Despite the lexical information being crucial for the task, syntactic structures have potential in being used to correctly decide among multiple candidate entities. Rules based on such structures have been used previously for the task. The objective of this thesis is to investigate, whether syntactic information influences the behavior of the state-of-the-art models such as recurrent neural networks for the OTE task. We did not find any substantial evidence to suggest that adding the syntactic information influences the behavior of the models.
Documents
Download Document Author Type File size
Download Text of the thesis Bc. Vladan Glončák 1.34 MB
Download Attachment to the thesis Bc. Vladan Glončák 62 kB
Download Abstract in czech Bc. Vladan Glončák 26 kB
Download Abstract in english Bc. Vladan Glončák 24 kB
Download Supervisor's review Mgr. Jan Hajič 51 kB
Download Opponent's review Mgr. Jindřich Helcl 78 kB
Download Defence's report prof. RNDr. Jan Hajič, Dr. 152 kB