PředmětyPředměty(verze: 978)
Předmět, akademický rok 2025/2026
   
Znalostní grafy, ontologie a lexikální sémantika - NPFL148
Anglický název: Knowledge Graphs, Ontologies and Lexical Semantics
Zajišťuje: Ústav formální a aplikované lingvistiky (32-UFAL)
Fakulta: Matematicko-fyzikální fakulta
Platnost: od 2025
Semestr: zimní
E-Kredity: 4
Rozsah, examinace: zimní s.:2/1, Z+Zk [HT]
Počet míst: neomezen
Minimální obsazenost: neomezen
4EU+: ne
Virtuální mobilita / počet míst pro virtuální mobilitu: ne
Stav předmětu: vyučován
Jazyk výuky: čeština, angličtina
Způsob výuky: prezenční
Garant: prof. RNDr. Jan Hajič, Dr.
Vyučující: prof. RNDr. Jan Hajič, Dr.
Třída: DS, matematická lingvistika
Informatika Mgr. - Matematická lingvistika
Kategorizace předmětu: Informatika > Počítačová a formální lingvistika
Anotace -
Kurz seznámí studenty se základy znalostních grafů, ontologií a lexikální sémantiky se zaměřením na jejich roli ve zpracování přirozeného jazyka (NLP) a v umělé inteligenci (AI). Pokrývá strukturu a využití znalostních grafů, funkci a oblasti použití ontologií a využití sémanticko-lexikálních zdrojů. Kurz se také zabývá vzájemnými vztahy těchto zdrojů v rámci počítačové lingvistiky a jak je lze spojit s využitím velkých jazykových modelů (LLM). Studenti během kurzu vypracují úkoly zahrnující anotaci textů, přhlednou prezentaci různých systémů a statistickou analýzu vybraných zdrojů.
Poslední úprava: Mírovský Jiří, RNDr., Ph.D. (20.05.2025)
Podmínky zakončení předmětu -

3 domácí úkoly následujícího typu:

o Testovací anotace textů (lexikální, textová)

o Přehled (s prezentací) různých systémů lexikální sémantiky/ontologií/znalostních grafů

o Statistická analýza (s využitím dostupných nástrojů) vybraného zdroje/tématu

Poslední úprava: Mírovský Jiří, RNDr., Ph.D. (20.05.2025)
Literatura -

Schneider, P., Schopf, T., Vladika, J., Galkin, M., Simperl, E., & Matthes, F. (2022). A Decade of Knowledge Graphs in Natural Language Processing: A Survey. arXiv preprint arXiv:2210.00105.

This paper systematically reviews the integration of knowledge graphs in NLP over the past decade.

Poole, D. L., & Mackworth, A. K. (2023). Knowledge Graphs and Ontologies. In Artificial Intelligence (pp. 701-730). Cambridge University Press. Also at https://artint.info/3e/html/ArtInt3e.Ch16.html.

This textbook chapter explores methods for representing knowledge using ontologies.

Navigli, R., & Ponzetto, S. P. (2012). BabelNet: The Automatic Construction, Evaluation and Application of a Wide-Coverage Multilingual Semantic Network. Artificial Intelligence, 193, 217-250.

BabelNet is a multilingual lexical-semantic knowledge graph that integrates WordNet and Wikipedia, providing a rich resource for NLP applications.

Palmer, M., Bonial, C., Hwang, J. D. (2017). VerbNet: Capturing English verb behavior, meaning and usage. The Oxford Handbook of Cognitive Science, ed. Susan Chipman. Oxford University Press.

Essential reading on one the first Lexical Semantic Resources focused on events, VerbNet.

Uresova, Z., Fucikova, E., Hajicova, E., Hajic J. (2020). SynSemClass Linked Lexicon: Mapping Synonymy between Languages. In Proceedings of the 2020 Globalex Workshop on Linked Lexicography, pages 10–19, Marseille, France. ELRA.

Multlingual Ontologies are essential for language understanding. SynSemClass focuses on eventives and describes them together with a hierarchy between the concepts.

Baker, C. (2014). FrameNet: A Knowledge Base for Natural Language Processing. In: Proceedings of Frame Semantics in NLP: A Workshop in Honor of Chuck Fillmore (1929-2014).

Overview of the FrameNet project for frame semantics.

Van Gysel, J.E.L., Vigus, M., Chun, J. et al. (2021). Designing a Uniform Meaning Representation for Natural Language Processing. Künstl Intell 35, 343–360. https://doi.org/10.1007/s13218-021-00722-w.

Article about a meaning representation for natural language texts that uses various lexical semantic resources.

Poslední úprava: Mírovský Jiří, RNDr., Ph.D. (20.05.2025)
Sylabus -

Studenti se seznámí se základy znalostních grafů, ontologií a jejich vztahem k lexikální sémantice a dalším lexikálním zdrojům využívaným v oblasti zpracování přirozeného jazyka (NLP) a umělé inteligence (AI).

Témata kurzu:

1. Úvod do kurzu, širší kontext (výzkum v oblasti výpočetní lingvistiky, zpracování přirozeného jazyka, umělá inteligence, velké jazykové modely, aplikace)

2. Základy znalostních grafů – definice, struktura, aplikace, sémantický web, významové/sémantické reprezentace textu/řeči/multimodální

3. Ontologie – definice, vztah k jazyku, příklady z různých domén (lingvistika, medicína a zdravotnictví, …)

4. Lexikální sémantika a slovníky – definice, příklady, využití v lingvistice a jazykových zdrojích

5. Vztah mezi lexikálními zdroji, ontologiemi a znalostními grafy se zaměřením na úlohy v NLP a AI

Poslední úprava: Mírovský Jiří, RNDr., Ph.D. (20.05.2025)
 
Univerzita Karlova | Informační systém UK