Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Multilingual Entity Linking Using Dense Retrieval
Název práce v češtině: Vícejazyčné propojování entit pomocí vektorového vyhledávání
Název v anglickém jazyce: Multilingual Entity Linking Using Dense Retrieval
Klíčová slova: propojování entit|vektorové vyhledávání|vícejazyčné propojování entit|bi-enkóder
Klíčová slova anglicky: entity linking|dense retrieval|entity disambiguation|multilingual entity linking|bi-encoder
Akademický rok vypsání: 2023/2024
Typ práce: bakalářská práce
Jazyk práce: angličtina
Ústav: Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel: RNDr. Milan Straka, Ph.D.
Řešitel: Dominik Farhan - zadáno a potvrzeno stud. odd.
Datum přihlášení: 24.01.2024
Datum zadání: 24.01.2024
Datum potvrzení stud. oddělením: 26.01.2024
Datum odevzdání elektronické podoby:09.05.2024
Zásady pro vypracování
The goal of the work is to implement and evaluate entity linking model using neural-network-based bi-encoder dense retrieval approach. WikiData should be used as a knowledge base, and contrary to prior work by large commercial companies, publicly available training data should be used. The evaluation should be performed in several languages, for example using the Mewsli-9 dataset.
Seznam odborné literatury
- Learning Dense Representations for Entity Retrieval. Daniel Gillick, Sayali Kulkarni, Larry Lansing, Alessandro Presta, Jason Baldridge, Eugene Ie, Diego Garcia-Olano. https://aclanthology.org/K19-1049/
- Entity Linking in 100 Languages. Jan A. Botha, Zifei Shan, Daniel Gillick. https://aclanthology.org/2020.emnlp-main.630/
- MOLEMAN: Mention-Only Linking of Entities with a Mention Annotation Network. Nicholas FitzGerald, Dan Bikel, Jan Botha, Daniel Gillick, Tom Kwiatkowski, Andrew McCallum. https://aclanthology.org/2021.acl-short.37/
- DaMuEL 1.0: A Large Multilingual Dataset for Entity Linking. LINDAT/CLARIAH-CZ digital library. http://hdl.handle.net/11234/1-5047
 
Univerzita Karlova | Informační systém UK