Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Rozpoznávání pojmenovaných entit v historických textech
Název práce v češtině: Rozpoznávání pojmenovaných entit v historických textech
Název v anglickém jazyce: Named entity recognition in historical daa
Klíčová slova: Rozpoznávání pojmenovaných entit|hluboké učení
Klíčová slova anglicky: named entity recognition|deep learning
Akademický rok vypsání: 2023/2024
Typ práce: diplomová práce
Jazyk práce:
Ústav: Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel: doc. RNDr. Pavel Pecina, Ph.D.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 08.03.2024
Datum zadání: 09.03.2024
Datum potvrzení stud. oddělením: 10.03.2024
Zásady pro vypracování
Téma práce spadá do oblasti rozpoznávání pojmenovaných entit v textu. Zatímco většina existujicích modelů pro tuto úlohu je určena pro použití na doménově nevyhraněných textech, práce bude zkoumat rozpoznávání pojmenovaných entit v historických textech, konkrétně v přepisech výpovědí svědků holokaustu z archívu USC SHOAH VHA. Cílem práce je seznámit se současnými moderními metodami pro rozpoznávání pojmenovaných entit, prozkoumat jejich vhodnost pro použití na uvedená data (zejména s ohledem na výběr trénovacích dat) a porovnat výstupy automatických metod s ručně přiřazenými metadaty, které jsou součástí archivu USC SHOAH VHA.
Seznam odborné literatury
Straková Jana, Straka Milan, Hajič Jan: Neural Architectures for Nested NER through Linearization. In: Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics, Copyright © Association for Computational Linguistics, Stroudsburg, PA, USA, ISBN 978-1-950737-48-2, pp. 5326-5331, 2019.

Helena Hubková, Pavel Kral, and Eva Pettersson. 2020. Czech Historical Named Entity Corpus v 1.0. In Proceedings of the Twelfth Language Resources and Evaluation Conference, pages 4458–4465, Marseille, France. European Language Resources Association.

Ehrmann, M., Romanello, M., Najem-Meyer, S., Doucet, A., Clematide, S. (2022). Overview of HIPE-2022: Named Entity Recognition and Linking in Multilingual Historical Documents. In: Barrón-Cedeño, A., et al. Experimental IR Meets Multilinguality, Multimodality, and Interaction. CLEF 2022. Lecture Notes in Computer Science, vol 13390. Springer, Cham.
 
Univerzita Karlova | Informační systém UK