PředmětyPředměty(verze: 867)
Předmět, akademický rok 2019/2020
  
Úvodní seminář matematické lingvistiky I - NPFL002
Anglický název: Introductory Seminar on Mathematical Linguistics I
Zajišťuje: Ústav formální a aplikované lingvistiky (32-UFAL)
Fakulta: Matematicko-fyzikální fakulta
Platnost: od 2016 do 2019
Semestr: zimní
E-Kredity: 3
Rozsah, examinace: zimní s.:0/2 Z [hodiny/týden]
Počet míst: neomezen
Minimální obsazenost: neomezen
Stav předmětu: nevyučován
Jazyk výuky: čeština
Způsob výuky: prezenční
Garant: doc. RNDr. Vladimír Petkevič, CSc.
Třída: Informatika Mgr. - volitelný
Kategorizace předmětu: Informatika > Počítačová a formální lingvistika
Anotace -
Poslední úprava: T_UFAL (12.01.2007)
Je vymezen předmět matematické lingvistiky, její základy a vztah k obecné lingvistice, matematice a informatice. Studují se matematické a informatické metody a formalismy pro popis přirozených jazyků s důrazem na morfologii a syntax. Hlavní strukturní vlastnosti přirozených jazyků se vystihují formálními gramatikami a automaty s důrazem na jejich generativní a explikativní sílu. Rovněž se studují základní vlastnosti lexikální, morfologické a syntaktické analýzy přirozených jazyků.
Literatura
Poslední úprava: T_UFAL (23.05.2003)

F. Čermák (1994): Jazyk a jazykověda. Pražská imaginace. Praha.

V. Fromkin, R. Rodman (1978): An Introduction to Language. Holt, Rinehart and Winston, New York.

A. V. Gladkij, I. A. Mel'čuk (1969): Elementy matematičeskoj lingvistiki. Moskva.

A. V. Gladkij (1973): Formal'nyje grammatiki i jazyki. Moskva.

Hajič J. (in press): Disambiguation of Rich Inflection (Computational Morphology of Czech), Vol. 1. Karolinum Charles University Press, Prague.

Harrison, M.A. (1978): Introduction to Formal Language Theory. Addison-Wesley Publ. Comp, Inc., Reading (Mass.).

Hajičová E., J. Panevová, P. Sgall (2002): Úvod do teoretické a počítačové lingvistiky. I. svazek - Teoretická lingvistika. Nakladatelství Karolinum, Univerzita Karlova v Praze, Praha.

Roland Hausser (2001): Foundations of Computational Linguistics. Human-Computer Communication in Natural Language. Springer-Verlag, Berlin, Heidelberg, New York.

J. E. Hopcroft, J. D. Ullman (1978): Formálne jazyky a automaty. Alfa, Bratislava.

Chomsky N. (1957): Syntactic Structures. Mouton, The Hague.

M. Chytil (1978): Teorie automatů a formálních jazyků. [Lecture notes.] SPN, Praha.

M. Chytil (1984): Automaty a gramatiky. SNTL Praha.

Karlsson F., Voutilainen A., Heikkilä J., Antilla A. (eds.) (1995): Constraint Grammar. A Language-Independent System for Parsing Unrestricted Text. Mouton de Gruyter, Berlin New York.

G. K. Krulee (1991): Computer Processing of Natural Language. Prentice-Hall, Inc., New Jersey.

J. Lyons (1968): Introduction to General Linguistics. Cambridge University Press, Cambridge.

Marcus S. (1969): Algebraické modely v lingvistice. Academia, Praha.

Mel'čuk I. A. (1988): Dependency Syntax. State University of New York Press, Albany.

Nebeský L. (1987): Kombinatorické vlastnosti větných struktur. Acta Universitatis Carolinae, Philologica, Monographia XCV - 1987, Univerzita Karlova, Praha.

Novotný M. (1988): S algebrou od jazyka ke gramatice a zpět. Academia, Praha.

Oliva K., M. Hnátková, V. Petkevič, P. Květoň (2000): The Linguistic Basis of a Rule-Based Tagger of Czech. Text, Speech and Dialogue. Proceedings of the Third International Workshop, TSD 2000, LNAI 1902, Brno 2000, 3-8.

B.H. Partee, A. ter Meulen, R. E. Wall (1990): Mathematical Methods in Linguistics. Kluwer Academic Publishers. Dordrecht, Boston, London.

Roche E., Y. Schabes (eds.) (1997): Finite-State Language Processing. The Massachusetts Institute of Technology, Mass.

Rozenberg, G., A. Salomaa (eds.) (1997): Handbook of Formal Languages. Springer-Verlag Berlin Heidelberg.

Sgall P. et al. (1986): Úvod do syntaxe a sémantiky. Academia, Praha.

Tesniere L. (1959): Eléments de syntaxe structurale. Klincksieck, Paris.

Sylabus -
Poslední úprava: T_UFAL (23.05.2003)
A. Co je MATEMATICKÁ LINGVISTIKA (dále ML)?

 • vymezení pojmů: počítačové zpracování přirozeného jazyka; počítačová (komputační) lingvistika; formální lingvistika; statistická lingvistika; kvantitativní lingvistika; algebraická lingvistika; aplikovaná lingvistika
 • vztah ML k matematice, zejména k: matematické teorii (formálních) jazyků a automatů; algebře; matematické logice; pravděpodobnosti a statistice; vztah ML k logice; vztah ML k informatice
 • přirozené a umělé jazyky
 • počítačová analýza a syntéza jazyka - nástin
 • úkoly počítačové lingvistiky

B. Základy matematické teorie jazyků: teorie formálních jazyků

 • formální generativní gramatiky - Chomského hierarchie gramatik a jazyků a její motivace
 • generativní a rekognoskativní procedury
 • rekurzivita, rekurzívní a rekurzívně-spočetné jazyky
 • vztah formálních gramatik a jazyků (přirozených a umělých)
 • lingvisticky motivované příklady formálních gramatik a jazyků generovaných těmito gramatikami
 • generativní (slabá) a explikativní síla gramatik

C. Bezprostředněsložkové gramatiky

 • motivace a definice bezprostředněsložkových gramatik
 • hlavní vlastnosti bezprostředněsložkových gramatik
 • slovosled a hierarchická složková struktura
 • jazyk vymezený bezprostředněsložkovou gramatikou a jeho vlastnosti
 • bezprostředněsložkový strom

D. Úvod do transformačních gramatik

 • báze, frázová gramatika, transformační gramatika, frázový ukazatel
 • transformace (zachovávající a nezachovávající význam), transformační gramatiky
 • hloubková a povrchová struktura věty
 • výhody a nevýhody transformačních gramatik

E. Úvod do teorie automatů

 • automaty jako matematické struktury (zařízení)
 • typy automatů z hlediska slabé (generativní) síly a jejich vztah k formálním gramatikám: konečné automaty, zásobníkové automaty, lineárně omezené automaty, Turingovy stroje
 • automaty jakožto akceptory a generátory
 • říklady přirozených (pod)jazyků zpracovávaných určitými typy automatů
 • využití konečných automatů pro zpracování morfologie a syntaxe přirozených jazyků; dvoustupňová morfologie

F. Závislostní gramatiky

 • základní charakteristika závislostních gramatik
 • generativní a explikativní síla závislostních gramatik, jejich porovnání s Chomského hierarchií a jejich postavení v rámci teorie formálních jazyků
 • algebraická reprezentace věty v závislostním pojetí - orientovaný strom
 • slovosled
 • projektiva a neprojektivita syntaktických struktur
 • koordinace a její zachycení v závislostní gramatice
 • srovnání bezprostředně-složkových a závislostních gramatik z hlediska explicitní síly
 • přibližování bezprostředně-složkových a závislostních gramatik - pokus o smíření

G. Kategoriální gramatiky

 • základní charakteristika kategoriálních gramatik
 • smysl kategoriálních gramatik a jejich vhodnost pro různé typy jazyků
 • vztah kategoriálních gramatik k bezprostředněsložkovým a závislostním gramatikám

F. Strukturní složitost přirozených jazyků z hlediska Chomského hierarchie

 • Možnosti a meze regulárních a bezkontextových gramatik pro zachycení různých morfologických a syntaktických jevů v přirozených jazycích
 • Kontextové jazyky. Typicky kontextové struktury přirozených jazyků
 • Jazyky a formalismy na pomezí bezkontextových a kontextových jazyků: indexové gramatiky, tree-adjoining gramatiky (TAG), head gramatiky

H. Automatická morfologická analýza a disambiguace přirozených jazyků

 • hlavní úkol a problémy morfologické analýzy
 • lemmatizace slovních tvarů i víceslovných výrazů
 • morfologická disambiguace, její problémy a metody
 • homonymie v přirozených jazycích, její typy a odstraňování

 
Univerzita Karlova | Informační systém UK