Thesis (Selection of subject)Thesis (Selection of subject)(version: 368)
Thesis details
   Login via CAS
Rozpoznávání pojmenovaných entit v historických textech
Thesis title in Czech: Rozpoznávání pojmenovaných entit v historických textech
Thesis title in English: Named entity recognition in historical daa
Key words: Rozpoznávání pojmenovaných entit|hluboké učení
English key words: named entity recognition|deep learning
Academic year of topic announcement: 2023/2024
Thesis type: diploma thesis
Thesis language:
Department: Institute of Formal and Applied Linguistics (32-UFAL)
Supervisor: doc. RNDr. Pavel Pecina, Ph.D.
Author: hidden - assigned and confirmed by the Study Dept.
Date of registration: 08.03.2024
Date of assignment: 09.03.2024
Confirmed by Study dept. on: 10.03.2024
Guidelines
Téma práce spadá do oblasti rozpoznávání pojmenovaných entit v textu. Zatímco většina existujicích modelů pro tuto úlohu je určena pro použití na doménově nevyhraněných textech, práce bude zkoumat rozpoznávání pojmenovaných entit v historických textech, konkrétně v přepisech výpovědí svědků holokaustu z archívu USC SHOAH VHA. Cílem práce je seznámit se současnými moderními metodami pro rozpoznávání pojmenovaných entit, prozkoumat jejich vhodnost pro použití na uvedená data (zejména s ohledem na výběr trénovacích dat) a porovnat výstupy automatických metod s ručně přiřazenými metadaty, které jsou součástí archivu USC SHOAH VHA.
References
Straková Jana, Straka Milan, Hajič Jan: Neural Architectures for Nested NER through Linearization. In: Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics, Copyright © Association for Computational Linguistics, Stroudsburg, PA, USA, ISBN 978-1-950737-48-2, pp. 5326-5331, 2019.

Helena Hubková, Pavel Kral, and Eva Pettersson. 2020. Czech Historical Named Entity Corpus v 1.0. In Proceedings of the Twelfth Language Resources and Evaluation Conference, pages 4458–4465, Marseille, France. European Language Resources Association.

Ehrmann, M., Romanello, M., Najem-Meyer, S., Doucet, A., Clematide, S. (2022). Overview of HIPE-2022: Named Entity Recognition and Linking in Multilingual Historical Documents. In: Barrón-Cedeño, A., et al. Experimental IR Meets Multilinguality, Multimodality, and Interaction. CLEF 2022. Lecture Notes in Computer Science, vol 13390. Springer, Cham.
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html