Thesis (Selection of subject)Thesis (Selection of subject)(version: 368)
Thesis details
   Login via CAS
Named Entity Recognition and Linking
Thesis title in Czech: Rozpoznávání a propojování pojmenovaných entit
Thesis title in English: Named Entity Recognition and Linking
Key words: pojmenované entity, rozpoznávání pojmenovaných entit, propojování pojmenovaných entit
English key words: named entities, named entity recognition, named entity linking
Academic year of topic announcement: 2015/2016
Thesis type: diploma thesis
Thesis language: angličtina
Department: Institute of Formal and Applied Linguistics (32-UFAL)
Supervisor: RNDr. Milan Straka, Ph.D.
Author: hidden - assigned and confirmed by the Study Dept.
Date of registration: 22.02.2016
Date of assignment: 22.02.2016
Confirmed by Study dept. on: 17.08.2016
Date and time of defence: 01.02.2017 09:00
Date of electronic submission:03.01.2017
Date of submission of printed version:04.01.2017
Date of proceeded defence: 01.02.2017
Opponents: Tomáš Kliegr
 
 
 
Guidelines
Cílem práce je vytvořit software pro rozpoznávání pojmenovaných entit a jejich následné propojení se znalostní databází entit. Rozpoznávání a propojování pojmenovaných entit je aktivně zkoumaný úkol zpracování přirozeného jazyka, v uplynulých letech proběhlo několik mezinárodních soutěží na toto téma: TAC KBP 2009-2015, ERD 2014, či NEEL Challenge 2014-2016.

Diplomová práce se bude skládat z několika částí. V první řadě musí být vytvořena znalostní databázi entit, a to z vhodných veřejně dostupných zdrojů -- například Wikipedie, DBpedie či Freebase. Dále je třeba vytvořit systém, který na základě anotovaných dat dokáže rozpoznat pojmenované entity a propojit je se znalostní databází. Tato diplomová práce se zaměřuje především na propojování pojmenovaných entit, k jejich rozpoznání je možné použít již existující nástroje. Úspěšnost vytvořeného systému bude vyhodnocena na dostupných datech z mezinárodních publikací a soutěží, například na CoNLL2003/AIDA (Hoffart et al. 2011) či na NEEL Challenge 2015 (Rizzo et al. 2015).
References
- Lev Ratinov and David Roth. Design challenges and misconceptions in named entity recognition. In Proceedings of the Thirteenth Conference on Computational Natural Language Learning (pp. 147-155). Association for Computational Linguistics. 2009. http://cogcomp.cs.illinois.edu/papers/RatinovRo09.pdf

- Johannes Hoffart et al. Robust Disambiguation of Named Entities in Text. In Proceedings of the Conference on Empirical Methods in Natural Language Processing (pp.
782-792). Association for Computational Linguistics. 2011. https://www.aclweb.org/anthology/D/D11/D11-1072.pdf

- David Carmel, Ming-Wei Chang, Evgeniy Gabrilovich, Bo-June (Paul) Hsu and Kuansan Wang. ERD 2014: Entity Recognition and Disambiguation Challenge. In SIGIR Forum 2014. Association for Computational Linguistics. 2014. http://web-ngram.research.microsoft.com/erd2014/Docs/ERD2014.pdf

- Heng Ji, Joel Nothman and Ben Hachey. Overview of TAC-KBP2014 Entity Discovery and Linking Tasks. In Proceedings of Text Analysis Conference (TAC2014). 2014. http://nlp.cs.rpi.edu/paper/edl2014overview.pdf

- Giuseppe Rizzo, Amparo Elizabeth Cano Basave, Bianca Pereira and Andrea Varga. Making Sense of Microposts (#Microposts2015) Named Entity rEcognition and Linking (NEEL) Challenge. In Proceedings of the Workshop on Making Sense of Microposts (#Microposts2015). 2015. http://ceur-ws.org/Vol-1395/microposts2015_neel-challenge-report/

- Chris Manning and Hinrich Schütze. Foundations of Statistical Natural Language Processing. The MIT Press. 1999. ISBN 0-262-13360-1.
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html