Pojmenované entity a ontologie metodami hlubokého učení
Název práce v češtině: | Pojmenované entity a ontologie metodami hlubokého učení |
---|---|
Název v anglickém jazyce: | Named Entity Linking by Deep Learning |
Klíčová slova: | pojmenované entity|propojení pojmenovaných entit|přirozený jazyk|BERT|hluboké učení |
Klíčová slova anglicky: | named entities|entity linking|natural language|BERT|contextualized embeddings|deep learning |
Akademický rok vypsání: | 2018/2019 |
Typ práce: | diplomová práce |
Jazyk práce: | angličtina |
Ústav: | Ústav formální a aplikované lingvistiky (32-UFAL) |
Vedoucí / školitel: | prof. RNDr. Jan Hajič, Dr. |
Řešitel: | skrytý![]() |
Datum přihlášení: | 03.12.2018 |
Datum zadání: | 03.12.2018 |
Datum potvrzení stud. oddělením: | 12.01.2021 |
Datum a čas obhajoby: | 04.02.2021 09:00 |
Datum odevzdání elektronické podoby: | 06.01.2021 |
Datum odevzdání tištěné podoby: | 06.01.2021 |
Datum proběhlé obhajoby: | 04.02.2021 |
Oponenti: | prof. Ing. Zdeněk Žabokrtský, Ph.D. |
Konzultanti: | RNDr. Jana Straková, Ph.D. |
Zásady pro vypracování |
Cílem diplomové práce je navrhnout, implementovat a experimentálně ověřit metodu pro propojení pojmenovaných entit a (otevřené) ontologické databáze (např. wikipedie). Vstupem do systému je text s již plně nebo částečně typově označenými výskyty pojmenovaných entit, výstupem je persistetní identifikátor (tj. URI) odpovídajícího záznamu ve zvolené ontologii, a to pro každý výskyt entity v textu. Metoda by měla být primárně založena na hlubokém učení (Deep Neural Networks) nebo jeho prvcích, avšak neměla by vyžadovat rozsáhlá trénovací data. Očekává se vytvoření několika modelů, které budou experimentálně porovnány. Výsledné systémy musí být ověřeny na testovacích datech pomocí standardně uznávaných metrik. Data budou poskytnuta pracovištěm vedoucího; rovněž bude poskytnuta výpočetní kapacita adekvátní pro řešení tohoto problému. |
Seznam odborné literatury |
Taufer, Pavel: Named Entity Linking. Diplomová práce, MFF UK, 2016.
Straková Jana, Straka Milan, Hajič Jan: Neural Networks for Featureless Named Entity Recognition in Czech. In: Lecture Notes in Computer Science, No. 9924, Text, Speech, and Dialogue: 19th International Conference, TSD 2016, ISBN 978-3-319-45509-9, ISSN 0302-9743, pp. 173-181, 2016 Straková Jana: Neural Network Based Named Entity Recognition. Ph.D. thesis, Charles University, Prague, Czech Republic, 120 pp., Jun 2017 Přednáška NPFL117 (http://ufal.mff.cuni.cz/courses/npfl117/1819-winter). |