Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Named Entity Recognition and Linking
Název práce v češtině: Rozpoznávání a propojování pojmenovaných entit
Název v anglickém jazyce: Named Entity Recognition and Linking
Klíčová slova: pojmenované entity, rozpoznávání pojmenovaných entit, propojování pojmenovaných entit
Klíčová slova anglicky: named entities, named entity recognition, named entity linking
Akademický rok vypsání: 2015/2016
Typ práce: diplomová práce
Jazyk práce: angličtina
Ústav: Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel: RNDr. Milan Straka, Ph.D.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 22.02.2016
Datum zadání: 22.02.2016
Datum potvrzení stud. oddělením: 17.08.2016
Datum a čas obhajoby: 01.02.2017 09:00
Datum odevzdání elektronické podoby:03.01.2017
Datum odevzdání tištěné podoby:04.01.2017
Datum proběhlé obhajoby: 01.02.2017
Oponenti: Tomáš Kliegr
 
 
 
Zásady pro vypracování
Cílem práce je vytvořit software pro rozpoznávání pojmenovaných entit a jejich následné propojení se znalostní databází entit. Rozpoznávání a propojování pojmenovaných entit je aktivně zkoumaný úkol zpracování přirozeného jazyka, v uplynulých letech proběhlo několik mezinárodních soutěží na toto téma: TAC KBP 2009-2015, ERD 2014, či NEEL Challenge 2014-2016.

Diplomová práce se bude skládat z několika částí. V první řadě musí být vytvořena znalostní databázi entit, a to z vhodných veřejně dostupných zdrojů -- například Wikipedie, DBpedie či Freebase. Dále je třeba vytvořit systém, který na základě anotovaných dat dokáže rozpoznat pojmenované entity a propojit je se znalostní databází. Tato diplomová práce se zaměřuje především na propojování pojmenovaných entit, k jejich rozpoznání je možné použít již existující nástroje. Úspěšnost vytvořeného systému bude vyhodnocena na dostupných datech z mezinárodních publikací a soutěží, například na CoNLL2003/AIDA (Hoffart et al. 2011) či na NEEL Challenge 2015 (Rizzo et al. 2015).
Seznam odborné literatury
- Lev Ratinov and David Roth. Design challenges and misconceptions in named entity recognition. In Proceedings of the Thirteenth Conference on Computational Natural Language Learning (pp. 147-155). Association for Computational Linguistics. 2009. http://cogcomp.cs.illinois.edu/papers/RatinovRo09.pdf

- Johannes Hoffart et al. Robust Disambiguation of Named Entities in Text. In Proceedings of the Conference on Empirical Methods in Natural Language Processing (pp.
782-792). Association for Computational Linguistics. 2011. https://www.aclweb.org/anthology/D/D11/D11-1072.pdf

- David Carmel, Ming-Wei Chang, Evgeniy Gabrilovich, Bo-June (Paul) Hsu and Kuansan Wang. ERD 2014: Entity Recognition and Disambiguation Challenge. In SIGIR Forum 2014. Association for Computational Linguistics. 2014. http://web-ngram.research.microsoft.com/erd2014/Docs/ERD2014.pdf

- Heng Ji, Joel Nothman and Ben Hachey. Overview of TAC-KBP2014 Entity Discovery and Linking Tasks. In Proceedings of Text Analysis Conference (TAC2014). 2014. http://nlp.cs.rpi.edu/paper/edl2014overview.pdf

- Giuseppe Rizzo, Amparo Elizabeth Cano Basave, Bianca Pereira and Andrea Varga. Making Sense of Microposts (#Microposts2015) Named Entity rEcognition and Linking (NEEL) Challenge. In Proceedings of the Workshop on Making Sense of Microposts (#Microposts2015). 2015. http://ceur-ws.org/Vol-1395/microposts2015_neel-challenge-report/

- Chris Manning and Hinrich Schütze. Foundations of Statistical Natural Language Processing. The MIT Press. 1999. ISBN 0-262-13360-1.
 
Univerzita Karlova | Informační systém UK