PředmětyPředměty(verze: 867)
Předmět, akademický rok 2019/2020
  
Úvodní seminář matematické lingvistiky II - NPFL031
Anglický název: Introductory Seminar on Mathematical Linguistics II
Zajišťuje: Ústav formální a aplikované lingvistiky (32-UFAL)
Fakulta: Matematicko-fyzikální fakulta
Platnost: od 2016 do 2019
Semestr: letní
E-Kredity: 3
Rozsah, examinace: letní s.:0/2 Z [hodiny/týden]
Počet míst: neomezen
Minimální obsazenost: neomezen
Stav předmětu: nevyučován
Jazyk výuky: čeština
Způsob výuky: prezenční
Garant: doc. RNDr. Vladimír Petkevič, CSc.
Třída: Informatika Mgr. - volitelný
Kategorizace předmětu: Informatika > Počítačová a formální lingvistika
Korekvizity : NPFL002
Anotace -
Poslední úprava: T_UFAL (25.05.2003)
Seminář navazuje na Úvodní seminář matematické lingvistiky I. Zabývá se těmito tématy: morfologická a syntaktická analýza přirozených jazyků; Funkční generativní popis jazyka (FGP); hlavní vlastnosti formálního popisu větné struktury; úvod do unifikačních gramatik a formalismů; hlavní gramatické teorie popisu přirozeného jazyka na Západě; úvod do korpusové lingvistiky.
Literatura
Poslední úprava: T_UFAL (23.05.2003)

Čermák F., J. Klímová, V. Petkevič (2000): Studie z korpusové lingvistiky. Nakladatelství Karolinum, Univerzita Karlova v Praze, Praha.

Český národní korpus (2000). Úvod a příručka uživatele. Ústav Českého národního korpusu FFUK. http://ucnk.ff.cuni.cz

Covington M. A. (1994): Natural Language Processing for Prolog Programmers. Prentice Hall, Englewood Cliffs, New Jersey.

Garside R., G. Leech, A. McEnery (eds.) (1997): Corpus Annotation. Linguistic Information from Computer Text Corpora. Longman, London, New York.

Karlsson F., A. Voutilainen, J. Heikkilä, A. Antilla (eds.) (1995): Constraint Grammar. A Language-Independent System for Parsing Unrestricted Text. Mouton de Gruyter, Berlin - New York.

Kennedy G. (1998): An Introduction to Corpus Linguistics. Longman, London.

Kuboň V. (2001): Problems of Robust Parsing of Czech. Doktorská disertační práce. ÚFAL MFF UK.

Květoň P., K. Oliva (2002): Achieving an Almost Correct PoS-Tagged Corpus. Text, Speech and Dialogue. Proceedings of the Fifth International Conference, TSD 2002, LNAI 2448, Brno, Czech Republic 2002, 19-26.

McEnery A.M. (1992): Computational Linguistics. Sigma Press, Wilmslow.

Panevová J. (1980): Formy a funkce ve stavbě české věty. Academia, Praha.

B.H. Partee, A. ter Meulen, R. E. Wall (1990): Mathematical Methods in Linguistics. Kluwer Academic Publishers. Dordrecht, Boston, London.

Petkevič V. (1995): A New Formal Specification of Underlying Structures. Theoretical Linguistics 21, No. 1, 1-61.

Sells P. (1985): Lectures on Contemporary Syntactic Theories. (An Introduction to Government-Binding Theory, Generalized Phrase Structure Grammar and Lexical Functional Grammar.) CSLI Lecture Note Series No. 3. CSLI Publications, Stanford (California).

Sgall P., Hajičová E., Buráňová E. (1980). Aktuální členění věty v češtině. Academia, Praha.

Sgall P. (ed.) (1984): Contributions to Functional Syntax, Semantics, and Language Comprehension. Academia, Praha.

Sgall P. et al. (1986): Úvod do syntaxe a sémantiky. Academia, Praha.

Shieber S. (1986): An Introduction to Unification-Based Approaches to Grammar. CSLI Lecture Note Series No. 4. CSLI, Stanford (California).

Wintner S. (1998): Unification-based Linguistic Formalisms. 10th European Summer School in Logic, Language and Information. Saarbruecken, BRD.

Sylabus -
Poslední úprava: T_UFAL (23.05.2003)
I. Syntaktická analýza (parsing) přirozených jazyků

 • hlavní cíle a problémy syntaktické analýzy obecně a přirozených jazyků zvláště
 • analyzovaný vstupní text, gramatika a syntaktický analyzátor (parser) - vzájemné vztahy
 • deklarativní a procedurální aspekty syntaktické analýzy
 • definite-clause grammars (DCG)
 • chunking, mělká syntaktická analýza
 • některé algoritmy syntaktické analýzy: top-down parsing, bottom-up parsing, left-corner parsing, chart-parsing, Earleyův algoritmus
 • vztah syntaktické analýzy a morfologické disambiguace

J. Základy Funkčního generativního popisu jazyka (FGP)

 • stratifikační lingvistika
 • FGP jako představitel stratifikačních popisů struktury přirozeného jazyka
 • charakteristika jednotlivých rovin ve FGP, elementární a komplexní jednotky
 • vztah reprezentace jako vztah formy a funkce, asymetrický dualismus
 • homonymie a synonymie
 • vztahy mezi rovinami, převodní složky

K. Rovina jazykového významu ve FGP (tektogramatická rovina):

 • rozlišení jazykového významu a mimojazykového obsahu
 • rozlišení hloubkové a povrchové struktury věty
 • charakteristika roviny jazykového významu: syntaktická struktura věty (závislostní, projektivní); zachycení koordinace; aktuální členění větné (AČV), hloubkový slovosled; negace a rematizátory a jejich dosah, jejich vztah k AČV; gramatická a textová koreference

L. Výkonné součásti FGP

 • generativní složka a její matematické podoby: závislostní gramatika; zásobníková závislostní gramatika
 • převodní složky FGP

M. FGP a Pražský závislostní korpus

 • smysl a charakteristika Pražského závislostního korpusu
 • analytická rovina
 • tektogramatická rovina

N. Úvod do unifikačních formalismů a gramatik

 • deklarativní a procedurální popis jazyka, nestratifikační popisy jazyka
 • motivace unifikačních formalismů a vztah k bezkontextovým gramatikám
 • struktury rysů
 • podspecifikace, subsumpce, unifikace, generalizace
 • orientovaný acyklický graf
 • návrh unifikačních gramatik pro popis různých syntaktických struktur
 • typy a jejich hierarchie
 • lexikalismus, vztah slovníku a gramatiky

O. Stručný přehled vlivných západních gramatických formalismů

 • teorie Řízení a vázání (Government and Binding)
 • Generalized Phrase-Structure Grammar
 • Lexical Functional Grammar
 • Head-Driven Phrase-Structure Grammar

P. Úvod do korpusové lingvistiky

 • předmět korpusové lingvistiky
 • počítačový jazykový korpus elektronických textů
 • koncepce a budování korpusu
 • typy korpusů
 • správní, textové a jazykové značkování korpusů; značkovací jazyky (SGML a XML)

 
Univerzita Karlova | Informační systém UK