velikost textu

Semantic relation extraction from unstructured data in the business domain

Upozornění: Informace získané z popisných dat či souborů uložených v Repozitáři závěrečných prací nemohou být použity k výdělečným účelům nebo vydávány za studijní, vědeckou nebo jinou tvůrčí činnost jiné osoby než autora.
Název:
Semantic relation extraction from unstructured data in the business domain
Název v češtině:
Extrakce sémantických vztahů z nestrukturovaných dat v komerční sféře
Typ:
Diplomová práce
Autor:
Mgr. Ilana Rampula
Vedoucí:
RNDr. Pavel Pecina, Ph.D.
Oponent:
doc. RNDr. Vladislav Kuboň, Ph.D.
Id práce:
163873
Fakulta:
Matematicko-fyzikální fakulta (MFF)
Pracoviště:
Ústav formální a aplikované lingvistiky (32-UFAL)
Program studia:
Informatika (N1801)
Obor studia:
Matematická lingvistika (IMLA)
Přidělovaný titul:
Mgr.
Datum obhajoby:
8. 6. 2016
Výsledek obhajoby:
Výborně
Jazyk práce:
Angličtina
Klíčová slova:
Nestrukturovaná Data, Získavání informací, Určování vztahů mezi entitami, Textová analytika, Distant Supervision, Snowball
Klíčová slova v angličtině:
Unstructured data, Information Retrieval, Relation Extraction, Text Analytics, Distant Supervision, Snowball
Abstrakt:
V posledních letech se využití textové analytiky v komerční sféřě postupně stává významým tématem pro vědecké a praktické aplikace. Zaměřili jsme se na určování vztahů mezi entitami z dat dodaných partnerskou společností. Analýza textu z této sféry ale vyžaduje jiný přístup: počítání s nepřesnostma a specifickými atributy. V této práci jsme se rozhodli ukázat využití dvou metod pro určování vztahů: tzv. Snowball systém a Metodu vzdáleného dohledu (z angl. Distant Supervision), které jsme přizpůsobili pro dodaná data. Dané metody byli implementovány pro využití strukturovaných a nestrukturovaných dat z firemní databáze. Klíčová slova: Získavání informací, Určování vztahů mezi entitami, Textová analytika, Distant Supervision, Snowball
Abstract v angličtině:
Text analytics in the business domain is a growing field in research and practical applications. We chose to concentrate on Relation Extraction from unstructured data which was provided by a corporate partner. Analyzing text from this domain requires a different approach, counting with irregularities and domain specific attributes. In this thesis, we present two methods for relation extraction. The Snowball system and the Distant Supervision method were both adapted for the unique data. The methods were implemented to use both structured and unstructured data from the database of the company. Keywords: Information Retrieval, Relation Extraction, Text Analytics, Distant Supervision, Snowball
Dokumenty
Stáhnout Dokument Autor Typ Velikost
Stáhnout Text práce Mgr. Ilana Rampula 1.65 MB
Stáhnout Abstrakt v českém jazyce Mgr. Ilana Rampula 98 kB
Stáhnout Abstrakt anglicky Mgr. Ilana Rampula 5 kB
Stáhnout Posudek vedoucího RNDr. Pavel Pecina, Ph.D. 13 kB
Stáhnout Posudek oponenta doc. RNDr. Vladislav Kuboň, Ph.D. 28 kB
Stáhnout Záznam o průběhu obhajoby 479 kB