Introduction to computational aspects of lexical semantics. Basic concepts and issues. Fundamental approaches to lexical
disambiguation.
Last update: T_KSVI (20.05.2009)
Předmět je úvodem do komputačních aspektů lexikální sémantiky přirozeného jazyka. Budou probrány fundamentální
principy a hlavní problémy této disciplíny, včetně přehledu základních metod lexikální desambiguace.
Last update: T_KSVI (20.05.2009)
Literature -
Hanks, P. (ed.): Lexicology. Critical Concepts in Linguistics. Routledge, 2008. (selected chapters)
Jurafsky, D. and Martin, J. H.: Speech and Language Processing. Prentice Hall Series in Artificial Intelligence, 2008. (selected chapters)
Agirre, E. and Edmonds, P. (eds.): Word Sense Disambiguation: Algorithms and Applications. Springer, 2007. (selected chapters)
Last update: T_KSVI (20.05.2009)
Hanks, P. (ed.): Lexicology. Critical Concepts in Linguistics. Routledge, 2008. (vybrané kapitoly)
Jurafsky, D. and Martin, J. H.: Speech and Language Processing. Prentice Hall Series in Artificial Intelligence, 2008. (vybrané kapitoly)
Agirre, E. and Edmonds, P. (eds.): Word Sense Disambiguation: Algorithms and Applications. Springer, 2007. (vybrané kapitoly)
Last update: T_KSVI (20.05.2009)
Syllabus -
1. Introduction
Lexical semantics as a field of study and its historical development. Relation to other fields of computational linguistics and natural language processing.
2. Basic concepts
Words and meanings. Basic lexical relations. Ambiguity and vagueness in natural language. Lexical disambiguation and its possible applications.
3. Structure of lexicons
Lexical entries, lexical items, sense definitions, syntagmatic and semantic information in lexicons.
4. Existing lexical resources
Electronic dictionaries and other related electronic knowledge sources. Valency dictionaries. Semantic lexical networks.
5. Corpus lexicography
Statistical tools for corpus analysis. Lexical association measures. Collocations as semantic clues.
6. Word sense disambiguation
The task and fundamental methods. Algorithms, heuristics, and knowledge sources used in the field. Verb valency frames disambiguation. Corpus pattern analysis.
Last update: T_KSVI (20.05.2009)
1. Úvod
Lexikální sémantika jako obor a její historický vývoj. Vztah k ostatním disciplínám komputační ligvistiky a počítačového zpracování přirozeného jazyka.
2. Základní pojmy
Slova a jejich významy. Základní lexikální vztahy. Nejednoznačnost a vágnost v přirozeném jazyce. Lexikální desambiguce a možné aplikace.
3. Struktura slovníků
Struktura slovníkových hesel, definice významů, syntagmatická a sémantická informace ve slovnících.
4. Existující lexikální datové zdroje
Elektronické slovníky a jiné související zdroje informací. Valenční slovníky. Sémantické lexikální sítě.
5. Korpusová lexikografie
Statistické nástroje pro analýzu korpusů. Míry lexikální asociace. Kolokace jako klíč k sémantice.
6. Desambiguace slovních významů
Definice úlohy a základní přístupy k jejímu řešení. Používané algoritmy, heuristiky a datové zdroje. Desambiguace valenčních rámců. Korpusová analýza typických vzorů užívání slov.