Entity Relationship Extraction
Název práce v češtině: | Extrakce vztahů mezi entitami |
---|---|
Název v anglickém jazyce: | Entity Relationship Extraction |
Klíčová slova: | entity, pojmenované entity, vztahy mezi entitami, extrakce vztahů mezi entitami, čeština, BERT |
Klíčová slova anglicky: | entities, named entities, entity relationship, entity relationship extraction, Czech, BERT |
Akademický rok vypsání: | 2019/2020 |
Typ práce: | diplomová práce |
Jazyk práce: | angličtina |
Ústav: | Ústav formální a aplikované lingvistiky (32-UFAL) |
Vedoucí / školitel: | RNDr. Milan Straka, Ph.D. |
Řešitel: | skrytý - zadáno a potvrzeno stud. odd. |
Datum přihlášení: | 23.02.2020 |
Datum zadání: | 27.02.2020 |
Datum potvrzení stud. oddělením: | 12.03.2020 |
Datum a čas obhajoby: | 14.09.2020 09:00 |
Datum odevzdání elektronické podoby: | 30.07.2020 |
Datum odevzdání tištěné podoby: | 30.07.2020 |
Datum proběhlé obhajoby: | 14.09.2020 |
Oponenti: | Mgr. Pavel Straňák, Ph.D. |
Zásady pro vypracování |
Initial text processing usually stars with segmentation and tokenization, followed by morphological and syntactic analysis. Then, named entities are recognized and possibly linked to a knowledge base. Finally, relations between entities are extracted, to form a semantic graph representation of the given text. While the entity relations can be sometimes found in the knowledge base, the relationship extractions should work also in cases when the relationship or the entities are not present in the knowledge base.
The goal of this thesis is to design and implement relationship extraction for Czech language. Given the lack of supervised data, first part of the thesis is to create a distance-supervised dataset using existing knowledge bases. The second part is the design and implementation of a relationship extraction model. Apart from using it on Czech, it should be evaluated also on some well-known English dataset. |
Seznam odborné literatury |
- Sebastian Riedel, Limin Yao, and Andrew McCallum: Modeling Relations and Their Mentions without Labeled Text (creation of NYT dataset using distant supervision)
- http://nlpprogress.com/english/relationship_extraction.html (overview of English well-known datasets and current best models) |