Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Entity Relationship Extraction
Název práce v češtině: Extrakce vztahů mezi entitami
Název v anglickém jazyce: Entity Relationship Extraction
Klíčová slova: entity, pojmenované entity, vztahy mezi entitami, extrakce vztahů mezi entitami, čeština, BERT
Klíčová slova anglicky: entities, named entities, entity relationship, entity relationship extraction, Czech, BERT
Akademický rok vypsání: 2019/2020
Typ práce: diplomová práce
Jazyk práce: angličtina
Ústav: Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel: RNDr. Milan Straka, Ph.D.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 23.02.2020
Datum zadání: 27.02.2020
Datum potvrzení stud. oddělením: 12.03.2020
Datum a čas obhajoby: 14.09.2020 09:00
Datum odevzdání elektronické podoby:30.07.2020
Datum odevzdání tištěné podoby:30.07.2020
Datum proběhlé obhajoby: 14.09.2020
Oponenti: Mgr. Pavel Straňák, Ph.D.
 
 
 
Zásady pro vypracování
Initial text processing usually stars with segmentation and tokenization, followed by morphological and syntactic analysis. Then, named entities are recognized and possibly linked to a knowledge base. Finally, relations between entities are extracted, to form a semantic graph representation of the given text. While the entity relations can be sometimes found in the knowledge base, the relationship extractions should work also in cases when the relationship or the entities are not present in the knowledge base.

The goal of this thesis is to design and implement relationship extraction for Czech language. Given the lack of supervised data, first part of the thesis is to create a distance-supervised dataset using existing knowledge bases. The second part is the design and implementation of a relationship extraction model. Apart from using it on Czech, it should be evaluated also on some well-known English dataset.
Seznam odborné literatury
- Sebastian Riedel, Limin Yao, and Andrew McCallum: Modeling Relations and Their Mentions without Labeled Text (creation of NYT dataset using distant supervision)

- http://nlpprogress.com/english/relationship_extraction.html (overview of English well-known datasets and current best models)
 
Univerzita Karlova | Informační systém UK