Multilingual Entity Linking Using Dense Retrieval
Název práce v češtině: | Vícejazyčné propojování entit pomocí vektorového vyhledávání |
---|---|
Název v anglickém jazyce: | Multilingual Entity Linking Using Dense Retrieval |
Klíčová slova: | propojování entit|vektorové vyhledávání|vícejazyčné propojování entit|bi-enkóder |
Klíčová slova anglicky: | entity linking|dense retrieval|entity disambiguation|multilingual entity linking|bi-encoder |
Akademický rok vypsání: | 2023/2024 |
Typ práce: | bakalářská práce |
Jazyk práce: | angličtina |
Ústav: | Ústav formální a aplikované lingvistiky (32-UFAL) |
Vedoucí / školitel: | RNDr. Milan Straka, Ph.D. |
Řešitel: | Bc. Dominik Farhan - zadáno a potvrzeno stud. odd. |
Datum přihlášení: | 24.01.2024 |
Datum zadání: | 24.01.2024 |
Datum potvrzení stud. oddělením: | 26.01.2024 |
Datum a čas obhajoby: | 28.06.2024 09:00 |
Datum odevzdání elektronické podoby: | 09.05.2024 |
Datum odevzdání tištěné podoby: | 09.05.2024 |
Datum proběhlé obhajoby: | 28.06.2024 |
Oponenti: | doc. RNDr. Ondřej Bojar, Ph.D. |
Zásady pro vypracování |
The goal of the work is to implement and evaluate entity linking model using neural-network-based bi-encoder dense retrieval approach. WikiData should be used as a knowledge base, and contrary to prior work by large commercial companies, publicly available training data should be used. The evaluation should be performed in several languages, for example using the Mewsli-9 dataset. |
Seznam odborné literatury |
- Learning Dense Representations for Entity Retrieval. Daniel Gillick, Sayali Kulkarni, Larry Lansing, Alessandro Presta, Jason Baldridge, Eugene Ie, Diego Garcia-Olano. https://aclanthology.org/K19-1049/
- Entity Linking in 100 Languages. Jan A. Botha, Zifei Shan, Daniel Gillick. https://aclanthology.org/2020.emnlp-main.630/ - MOLEMAN: Mention-Only Linking of Entities with a Mention Annotation Network. Nicholas FitzGerald, Dan Bikel, Jan Botha, Daniel Gillick, Tom Kwiatkowski, Andrew McCallum. https://aclanthology.org/2021.acl-short.37/ - DaMuEL 1.0: A Large Multilingual Dataset for Entity Linking. LINDAT/CLARIAH-CZ digital library. http://hdl.handle.net/11234/1-5047 |