velikost textu

Využití syntaktické informace pro identifikaci hodnocených entit

Upozornění: Informace získané z popisných dat či souborů uložených v Repozitáři závěrečných prací nemohou být použity k výdělečným účelům nebo vydávány za studijní, vědeckou nebo jinou tvůrčí činnost jiné osoby než autora.
Název:
Využití syntaktické informace pro identifikaci hodnocených entit
Název v angličtině:
Using Syntactic Features for Opinion Target Identification
Typ:
Diplomová práce
Autor:
Bc. Vladan Glončák
Vedoucí:
Mgr. Jan Hajič
Oponent:
Mgr. Jindřich Helcl
Konzultant:
Mgr. Kateřina Veselovská
Id práce:
213860
Fakulta:
Matematicko-fyzikální fakulta (MFF)
Pracoviště:
Ústav formální a aplikované lingvistiky (32-UFAL)
Program studia:
Informatika (N1801)
Obor studia:
Matematická lingvistika (IML)
Přidělovaný titul:
Mgr.
Datum obhajoby:
9. 9. 2019
Výsledek obhajoby:
Velmi dobře
Jazyk práce:
Angličtina
Klíčová slova:
Identifikace hodnocených entit, analýza sentimentu, syntax, Universal Dependencies, strojové učení
Klíčová slova v angličtině:
Opinion Target Identification, Sentiment Analysis, Syntax, Universal Dependencies, Machine Learning
Abstrakt:
Identifikace hodnocených entit (Opinion Target Extraction, OTE) je zavedená pod-úloha analýzy sentimentu. Zatímco detekce subjektivních výroků a určení jejich polarity (pozitivní, nebo negativní) je samo o sobě užitečné, schopnost identifikovat i tyto „cílové“ entity poskytuje mnohem kvalitnější podklady pro rozhodování: majitelka restaurace potřebuje vědět, jestli si hosté stěžují na obsluhu, jídlo, atmosféru, či další aspekty jejího podniku, atp. Ačkoliv tato úloha má stále silnou lexikální složku, je zde i velký potenciál využít obecných syntaktických konstrukcí v evaluativních výrocích: v jedné větě například může být potenciálních cílových entit více, a přiřazení správného cíle k hodnotícímu výroku tak je záležitostí správného rozlišení v syntaktické struktuře věty. Syntaktické vzorce spojené s evlauativními výroky již byly popsány. Tato diplomová práce si klade za cíl zkoumat, jak přítomnost syntaktické informace ovlivňuje na úloze extrakce cílových entit (OTE) chování state-of-the-art modelů strojového učení, jako například rekurentních neuronových sítí. Nepodařilo se nám najít žádné přesvědčivé důkazy, které by nasvědčovaly, že přítomnost syntaktické informace výrazně ovlivňuje chování zvolených modelů.
Abstract v angličtině:
Opinion Target Extraction (OTE) is a well-established subtask of sentiment analysis. While detecting sentiment polarity is useful in itself, the ability to extract the targets of the opinions allows for more thorough decision making. For example, an owner of a restaurant needs to know whether the guests are complaining about the food, or the ambience, or any other aspect of their establishment, etc. Despite the lexical information being crucial for the task, syntactic structures have potential in being used to correctly decide among multiple candidate entities. Rules based on such structures have been used previously for the task. The objective of this thesis is to investigate, whether syntactic information influences the behavior of the state-of-the-art models such as recurrent neural networks for the OTE task. We did not find any substantial evidence to suggest that adding the syntactic information influences the behavior of the models.
Dokumenty
Stáhnout Dokument Autor Typ Velikost
Stáhnout Text práce Bc. Vladan Glončák 1.34 MB
Stáhnout Příloha k práci Bc. Vladan Glončák 62 kB
Stáhnout Abstrakt v českém jazyce Bc. Vladan Glončák 26 kB
Stáhnout Abstrakt anglicky Bc. Vladan Glončák 24 kB
Stáhnout Posudek vedoucího Mgr. Jan Hajič 51 kB
Stáhnout Posudek oponenta Mgr. Jindřich Helcl 78 kB
Stáhnout Záznam o průběhu obhajoby prof. RNDr. Jan Hajič, Dr. 152 kB