Pojmenované entity a ontologie metodami hlubokého učení
Thesis title in Czech: | Pojmenované entity a ontologie metodami hlubokého učení |
---|---|
Thesis title in English: | Named Entity Linking by Deep Learning |
Key words: | pojmenované entity|propojení pojmenovaných entit|přirozený jazyk|BERT|hluboké učení |
English key words: | named entities|entity linking|natural language|BERT|contextualized embeddings|deep learning |
Academic year of topic announcement: | 2018/2019 |
Thesis type: | diploma thesis |
Thesis language: | angličtina |
Department: | Institute of Formal and Applied Linguistics (32-UFAL) |
Supervisor: | prof. RNDr. Jan Hajič, Dr. |
Author: | hidden - assigned and confirmed by the Study Dept. |
Date of registration: | 03.12.2018 |
Date of assignment: | 03.12.2018 |
Confirmed by Study dept. on: | 12.01.2021 |
Date and time of defence: | 04.02.2021 09:00 |
Date of electronic submission: | 06.01.2021 |
Date of submission of printed version: | 06.01.2021 |
Date of proceeded defence: | 04.02.2021 |
Opponents: | doc. Ing. Zdeněk Žabokrtský, Ph.D. |
Advisors: | RNDr. Jana Straková, Ph.D. |
Guidelines |
Cílem diplomové práce je navrhnout, implementovat a experimentálně ověřit metodu pro propojení pojmenovaných entit a (otevřené) ontologické databáze (např. wikipedie). Vstupem do systému je text s již plně nebo částečně typově označenými výskyty pojmenovaných entit, výstupem je persistetní identifikátor (tj. URI) odpovídajícího záznamu ve zvolené ontologii, a to pro každý výskyt entity v textu. Metoda by měla být primárně založena na hlubokém učení (Deep Neural Networks) nebo jeho prvcích, avšak neměla by vyžadovat rozsáhlá trénovací data. Očekává se vytvoření několika modelů, které budou experimentálně porovnány. Výsledné systémy musí být ověřeny na testovacích datech pomocí standardně uznávaných metrik. Data budou poskytnuta pracovištěm vedoucího; rovněž bude poskytnuta výpočetní kapacita adekvátní pro řešení tohoto problému. |
References |
Taufer, Pavel: Named Entity Linking. Diplomová práce, MFF UK, 2016.
Straková Jana, Straka Milan, Hajič Jan: Neural Networks for Featureless Named Entity Recognition in Czech. In: Lecture Notes in Computer Science, No. 9924, Text, Speech, and Dialogue: 19th International Conference, TSD 2016, ISBN 978-3-319-45509-9, ISSN 0302-9743, pp. 173-181, 2016 Straková Jana: Neural Network Based Named Entity Recognition. Ph.D. thesis, Charles University, Prague, Czech Republic, 120 pp., Jun 2017 Přednáška NPFL117 (http://ufal.mff.cuni.cz/courses/npfl117/1819-winter). |