Rozpoznávání pojmenovaných entit v historických textech
Název práce v češtině: | Rozpoznávání pojmenovaných entit v historických textech |
---|---|
Název v anglickém jazyce: | Named entity recognition in historical daa |
Klíčová slova: | Rozpoznávání pojmenovaných entit|hluboké učení |
Klíčová slova anglicky: | named entity recognition|deep learning |
Akademický rok vypsání: | 2023/2024 |
Typ práce: | diplomová práce |
Jazyk práce: | |
Ústav: | Ústav formální a aplikované lingvistiky (32-UFAL) |
Vedoucí / školitel: | doc. RNDr. Pavel Pecina, Ph.D. |
Řešitel: | skrytý - zadáno a potvrzeno stud. odd. |
Datum přihlášení: | 08.03.2024 |
Datum zadání: | 09.03.2024 |
Datum potvrzení stud. oddělením: | 10.03.2024 |
Zásady pro vypracování |
Téma práce spadá do oblasti rozpoznávání pojmenovaných entit v textu. Zatímco většina existujicích modelů pro tuto úlohu je určena pro použití na doménově nevyhraněných textech, práce bude zkoumat rozpoznávání pojmenovaných entit v historických textech, konkrétně v přepisech výpovědí svědků holokaustu z archívu USC SHOAH VHA. Cílem práce je seznámit se současnými moderními metodami pro rozpoznávání pojmenovaných entit, prozkoumat jejich vhodnost pro použití na uvedená data (zejména s ohledem na výběr trénovacích dat) a porovnat výstupy automatických metod s ručně přiřazenými metadaty, které jsou součástí archivu USC SHOAH VHA. |
Seznam odborné literatury |
Straková Jana, Straka Milan, Hajič Jan: Neural Architectures for Nested NER through Linearization. In: Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics, Copyright © Association for Computational Linguistics, Stroudsburg, PA, USA, ISBN 978-1-950737-48-2, pp. 5326-5331, 2019.
Helena Hubková, Pavel Kral, and Eva Pettersson. 2020. Czech Historical Named Entity Corpus v 1.0. In Proceedings of the Twelfth Language Resources and Evaluation Conference, pages 4458–4465, Marseille, France. European Language Resources Association. Ehrmann, M., Romanello, M., Najem-Meyer, S., Doucet, A., Clematide, S. (2022). Overview of HIPE-2022: Named Entity Recognition and Linking in Multilingual Historical Documents. In: Barrón-Cedeño, A., et al. Experimental IR Meets Multilinguality, Multimodality, and Interaction. CLEF 2022. Lecture Notes in Computer Science, vol 13390. Springer, Cham. |