Rozpoznávání pojmenovaných entit v historických textech
Thesis title in Czech: | Rozpoznávání pojmenovaných entit v historických textech |
---|---|
Thesis title in English: | Named entity recognition in historical daa |
Key words: | Rozpoznávání pojmenovaných entit|hluboké učení |
English key words: | named entity recognition|deep learning |
Academic year of topic announcement: | 2023/2024 |
Thesis type: | diploma thesis |
Thesis language: | |
Department: | Institute of Formal and Applied Linguistics (32-UFAL) |
Supervisor: | doc. RNDr. Pavel Pecina, Ph.D. |
Author: | hidden - assigned and confirmed by the Study Dept. |
Date of registration: | 08.03.2024 |
Date of assignment: | 09.03.2024 |
Confirmed by Study dept. on: | 10.03.2024 |
Guidelines |
Téma práce spadá do oblasti rozpoznávání pojmenovaných entit v textu. Zatímco většina existujicích modelů pro tuto úlohu je určena pro použití na doménově nevyhraněných textech, práce bude zkoumat rozpoznávání pojmenovaných entit v historických textech, konkrétně v přepisech výpovědí svědků holokaustu z archívu USC SHOAH VHA. Cílem práce je seznámit se současnými moderními metodami pro rozpoznávání pojmenovaných entit, prozkoumat jejich vhodnost pro použití na uvedená data (zejména s ohledem na výběr trénovacích dat) a porovnat výstupy automatických metod s ručně přiřazenými metadaty, které jsou součástí archivu USC SHOAH VHA. |
References |
Straková Jana, Straka Milan, Hajič Jan: Neural Architectures for Nested NER through Linearization. In: Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics, Copyright © Association for Computational Linguistics, Stroudsburg, PA, USA, ISBN 978-1-950737-48-2, pp. 5326-5331, 2019.
Helena Hubková, Pavel Kral, and Eva Pettersson. 2020. Czech Historical Named Entity Corpus v 1.0. In Proceedings of the Twelfth Language Resources and Evaluation Conference, pages 4458–4465, Marseille, France. European Language Resources Association. Ehrmann, M., Romanello, M., Najem-Meyer, S., Doucet, A., Clematide, S. (2022). Overview of HIPE-2022: Named Entity Recognition and Linking in Multilingual Historical Documents. In: Barrón-Cedeño, A., et al. Experimental IR Meets Multilinguality, Multimodality, and Interaction. CLEF 2022. Lecture Notes in Computer Science, vol 13390. Springer, Cham. |