Named Entity Recognition and Linking
Thesis title in Czech: | Rozpoznávání a propojování pojmenovaných entit |
---|---|
Thesis title in English: | Named Entity Recognition and Linking |
Key words: | pojmenované entity, rozpoznávání pojmenovaných entit, propojování pojmenovaných entit |
English key words: | named entities, named entity recognition, named entity linking |
Academic year of topic announcement: | 2015/2016 |
Thesis type: | diploma thesis |
Thesis language: | angličtina |
Department: | Institute of Formal and Applied Linguistics (32-UFAL) |
Supervisor: | RNDr. Milan Straka, Ph.D. |
Author: | hidden - assigned and confirmed by the Study Dept. |
Date of registration: | 22.02.2016 |
Date of assignment: | 22.02.2016 |
Confirmed by Study dept. on: | 17.08.2016 |
Date and time of defence: | 01.02.2017 09:00 |
Date of electronic submission: | 03.01.2017 |
Date of submission of printed version: | 04.01.2017 |
Date of proceeded defence: | 01.02.2017 |
Opponents: | Tomáš Kliegr |
Guidelines |
Cílem práce je vytvořit software pro rozpoznávání pojmenovaných entit a jejich následné propojení se znalostní databází entit. Rozpoznávání a propojování pojmenovaných entit je aktivně zkoumaný úkol zpracování přirozeného jazyka, v uplynulých letech proběhlo několik mezinárodních soutěží na toto téma: TAC KBP 2009-2015, ERD 2014, či NEEL Challenge 2014-2016.
Diplomová práce se bude skládat z několika částí. V první řadě musí být vytvořena znalostní databázi entit, a to z vhodných veřejně dostupných zdrojů -- například Wikipedie, DBpedie či Freebase. Dále je třeba vytvořit systém, který na základě anotovaných dat dokáže rozpoznat pojmenované entity a propojit je se znalostní databází. Tato diplomová práce se zaměřuje především na propojování pojmenovaných entit, k jejich rozpoznání je možné použít již existující nástroje. Úspěšnost vytvořeného systému bude vyhodnocena na dostupných datech z mezinárodních publikací a soutěží, například na CoNLL2003/AIDA (Hoffart et al. 2011) či na NEEL Challenge 2015 (Rizzo et al. 2015). |
References |
- Lev Ratinov and David Roth. Design challenges and misconceptions in named entity recognition. In Proceedings of the Thirteenth Conference on Computational Natural Language Learning (pp. 147-155). Association for Computational Linguistics. 2009. http://cogcomp.cs.illinois.edu/papers/RatinovRo09.pdf
- Johannes Hoffart et al. Robust Disambiguation of Named Entities in Text. In Proceedings of the Conference on Empirical Methods in Natural Language Processing (pp. 782-792). Association for Computational Linguistics. 2011. https://www.aclweb.org/anthology/D/D11/D11-1072.pdf - David Carmel, Ming-Wei Chang, Evgeniy Gabrilovich, Bo-June (Paul) Hsu and Kuansan Wang. ERD 2014: Entity Recognition and Disambiguation Challenge. In SIGIR Forum 2014. Association for Computational Linguistics. 2014. http://web-ngram.research.microsoft.com/erd2014/Docs/ERD2014.pdf - Heng Ji, Joel Nothman and Ben Hachey. Overview of TAC-KBP2014 Entity Discovery and Linking Tasks. In Proceedings of Text Analysis Conference (TAC2014). 2014. http://nlp.cs.rpi.edu/paper/edl2014overview.pdf - Giuseppe Rizzo, Amparo Elizabeth Cano Basave, Bianca Pereira and Andrea Varga. Making Sense of Microposts (#Microposts2015) Named Entity rEcognition and Linking (NEEL) Challenge. In Proceedings of the Workshop on Making Sense of Microposts (#Microposts2015). 2015. http://ceur-ws.org/Vol-1395/microposts2015_neel-challenge-report/ - Chris Manning and Hinrich Schütze. Foundations of Statistical Natural Language Processing. The MIT Press. 1999. ISBN 0-262-13360-1. |