PředmětyPředměty(verze: 945)
Předmět, akademický rok 2016/2017
   Přihlásit přes CAS
Úvodní seminář matematické lingvistiky I - NPFL002
Anglický název: Introductory Seminar on Mathematical Linguistics I
Zajišťuje: Ústav formální a aplikované lingvistiky (32-UFAL)
Fakulta: Matematicko-fyzikální fakulta
Platnost: od 2016 do 2019
Semestr: zimní
E-Kredity: 3
Rozsah, examinace: zimní s.:0/2, Z [HT]
Počet míst: neomezen
Minimální obsazenost: neomezen
4EU+: ne
Virtuální mobilita / počet míst pro virtuální mobilitu: ne
Stav předmětu: nevyučován
Jazyk výuky: čeština
Způsob výuky: prezenční
Způsob výuky: prezenční
Garant: doc. RNDr. Vladimír Petkevič, CSc.
Třída: Informatika Mgr. - volitelný
Kategorizace předmětu: Informatika > Počítačová a formální lingvistika
Je korekvizitou pro: NPFL031
Výsledky anket   Termíny zkoušek   Rozvrh   Nástěnka   
Anotace -
Poslední úprava: T_UFAL (12.01.2007)
Je vymezen předmět matematické lingvistiky, její základy a vztah k obecné lingvistice, matematice a informatice. Studují se matematické a informatické metody a formalismy pro popis přirozených jazyků s důrazem na morfologii a syntax. Hlavní strukturní vlastnosti přirozených jazyků se vystihují formálními gramatikami a automaty s důrazem na jejich generativní a explikativní sílu. Rovněž se studují základní vlastnosti lexikální, morfologické a syntaktické analýzy přirozených jazyků.
Literatura
Poslední úprava: T_UFAL (23.05.2003)

F. Čermák (1994): Jazyk a jazykověda. Pražská imaginace. Praha.

V. Fromkin, R. Rodman (1978): An Introduction to Language. Holt, Rinehart and Winston, New York.

A. V. Gladkij, I. A. Mel'čuk (1969): Elementy matematičeskoj lingvistiki. Moskva.

A. V. Gladkij (1973): Formal'nyje grammatiki i jazyki. Moskva.

Hajič J. (in press): Disambiguation of Rich Inflection (Computational Morphology of Czech), Vol. 1. Karolinum Charles University Press, Prague.

Harrison, M.A. (1978): Introduction to Formal Language Theory. Addison-Wesley Publ. Comp, Inc., Reading (Mass.).

Hajičová E., J. Panevová, P. Sgall (2002): Úvod do teoretické a počítačové lingvistiky. I. svazek - Teoretická lingvistika. Nakladatelství Karolinum, Univerzita Karlova v Praze, Praha.

Roland Hausser (2001): Foundations of Computational Linguistics. Human-Computer Communication in Natural Language. Springer-Verlag, Berlin, Heidelberg, New York.

J. E. Hopcroft, J. D. Ullman (1978): Formálne jazyky a automaty. Alfa, Bratislava.

Chomsky N. (1957): Syntactic Structures. Mouton, The Hague.

M. Chytil (1978): Teorie automatů a formálních jazyků. [Lecture notes.] SPN, Praha.

M. Chytil (1984): Automaty a gramatiky. SNTL Praha.

Karlsson F., Voutilainen A., Heikkilä J., Antilla A. (eds.) (1995): Constraint Grammar. A Language-Independent System for Parsing Unrestricted Text. Mouton de Gruyter, Berlin New York.

G. K. Krulee (1991): Computer Processing of Natural Language. Prentice-Hall, Inc., New Jersey.

J. Lyons (1968): Introduction to General Linguistics. Cambridge University Press, Cambridge.

Marcus S. (1969): Algebraické modely v lingvistice. Academia, Praha.

Mel'čuk I. A. (1988): Dependency Syntax. State University of New York Press, Albany.

Nebeský L. (1987): Kombinatorické vlastnosti větných struktur. Acta Universitatis Carolinae, Philologica, Monographia XCV - 1987, Univerzita Karlova, Praha.

Novotný M. (1988): S algebrou od jazyka ke gramatice a zpět. Academia, Praha.

Oliva K., M. Hnátková, V. Petkevič, P. Květoň (2000): The Linguistic Basis of a Rule-Based Tagger of Czech. Text, Speech and Dialogue. Proceedings of the Third International Workshop, TSD 2000, LNAI 1902, Brno 2000, 3-8.

B.H. Partee, A. ter Meulen, R. E. Wall (1990): Mathematical Methods in Linguistics. Kluwer Academic Publishers. Dordrecht, Boston, London.

Roche E., Y. Schabes (eds.) (1997): Finite-State Language Processing. The Massachusetts Institute of Technology, Mass.

Rozenberg, G., A. Salomaa (eds.) (1997): Handbook of Formal Languages. Springer-Verlag Berlin Heidelberg.

Sgall P. et al. (1986): Úvod do syntaxe a sémantiky. Academia, Praha.

Tesniere L. (1959): Eléments de syntaxe structurale. Klincksieck, Paris.

Sylabus -
Poslední úprava: T_UFAL (23.05.2003)
A. Co je MATEMATICKÁ LINGVISTIKA (dále ML)?

  • vymezení pojmů: počítačové zpracování přirozeného jazyka; počítačová (komputační) lingvistika; formální lingvistika; statistická lingvistika; kvantitativní lingvistika; algebraická lingvistika; aplikovaná lingvistika
  • vztah ML k matematice, zejména k: matematické teorii (formálních) jazyků a automatů; algebře; matematické logice; pravděpodobnosti a statistice; vztah ML k logice; vztah ML k informatice
  • přirozené a umělé jazyky
  • počítačová analýza a syntéza jazyka - nástin
  • úkoly počítačové lingvistiky

B. Základy matematické teorie jazyků: teorie formálních jazyků

  • formální generativní gramatiky - Chomského hierarchie gramatik a jazyků a její motivace
  • generativní a rekognoskativní procedury
  • rekurzivita, rekurzívní a rekurzívně-spočetné jazyky
  • vztah formálních gramatik a jazyků (přirozených a umělých)
  • lingvisticky motivované příklady formálních gramatik a jazyků generovaných těmito gramatikami
  • generativní (slabá) a explikativní síla gramatik

C. Bezprostředněsložkové gramatiky

  • motivace a definice bezprostředněsložkových gramatik
  • hlavní vlastnosti bezprostředněsložkových gramatik
  • slovosled a hierarchická složková struktura
  • jazyk vymezený bezprostředněsložkovou gramatikou a jeho vlastnosti
  • bezprostředněsložkový strom

D. Úvod do transformačních gramatik

  • báze, frázová gramatika, transformační gramatika, frázový ukazatel
  • transformace (zachovávající a nezachovávající význam), transformační gramatiky
  • hloubková a povrchová struktura věty
  • výhody a nevýhody transformačních gramatik

E. Úvod do teorie automatů

  • automaty jako matematické struktury (zařízení)
  • typy automatů z hlediska slabé (generativní) síly a jejich vztah k formálním gramatikám: konečné automaty, zásobníkové automaty, lineárně omezené automaty, Turingovy stroje
  • automaty jakožto akceptory a generátory
  • říklady přirozených (pod)jazyků zpracovávaných určitými typy automatů
  • využití konečných automatů pro zpracování morfologie a syntaxe přirozených jazyků; dvoustupňová morfologie

F. Závislostní gramatiky

  • základní charakteristika závislostních gramatik
  • generativní a explikativní síla závislostních gramatik, jejich porovnání s Chomského hierarchií a jejich postavení v rámci teorie formálních jazyků
  • algebraická reprezentace věty v závislostním pojetí - orientovaný strom
  • slovosled
  • projektiva a neprojektivita syntaktických struktur
  • koordinace a její zachycení v závislostní gramatice
  • srovnání bezprostředně-složkových a závislostních gramatik z hlediska explicitní síly
  • přibližování bezprostředně-složkových a závislostních gramatik - pokus o smíření

G. Kategoriální gramatiky

  • základní charakteristika kategoriálních gramatik
  • smysl kategoriálních gramatik a jejich vhodnost pro různé typy jazyků
  • vztah kategoriálních gramatik k bezprostředněsložkovým a závislostním gramatikám

F. Strukturní složitost přirozených jazyků z hlediska Chomského hierarchie

  • Možnosti a meze regulárních a bezkontextových gramatik pro zachycení různých morfologických a syntaktických jevů v přirozených jazycích
  • Kontextové jazyky. Typicky kontextové struktury přirozených jazyků
  • Jazyky a formalismy na pomezí bezkontextových a kontextových jazyků: indexové gramatiky, tree-adjoining gramatiky (TAG), head gramatiky

H. Automatická morfologická analýza a disambiguace přirozených jazyků

  • hlavní úkol a problémy morfologické analýzy
  • lemmatizace slovních tvarů i víceslovných výrazů
  • morfologická disambiguace, její problémy a metody
  • homonymie v přirozených jazycích, její typy a odstraňování

 
Univerzita Karlova | Informační systém UK