Předměty
Předměty(verze: 633)
Login :  Heslo :     
Předmět, akademický rok 2012/2013
 
Počítačové zpracování přirozeného jazyka - NPFL007
Anglický název: Computer Processing of Natural Language
Zajišťuje: Ústav formální a aplikované lingvistiky (32-UFAL)
Fakulta: Matematicko-fyzikální fakulta
Platnost: od 2010
Semestr: zimní
Rozsah, examinace: zimní s.:2/0 Z [hodiny/týden]
Body: zimní s.:2
E-Kredity: zimní s.:3
Počet míst: neomezen
Minimální obsazenost: neomezen
Stav předmětu: zrušen
Jazyk výuky:  
Další informace: http://ufal.mff.cuni.cz/~zeman/vyuka/podklady/index.html
Garant: RNDr. Daniel Zeman, Ph.D.
Třída: Informatika Mgr. - Matematická lingvistika
Klasifikace: Informatika > Počítačová a formální lingvistika
Anotace -
Poslední úprava: ZEMAN (11.05.2007)

Základní metody a algoritmy používané pro předzpracování a
zpracování textu z hlediska počítačového zpracování přirozeného
jazyka obecně a češtiny speciálně; kromě češtiny bude zvýšená
pozornost věnována ještě angličtině. Důraz bude kladen zejména na
nižší úrovně zpracování, se všeobecným úvodem do komplexních metod
zpracování. Základy jazyka Perl (pro zpracování textu).

Předpoklady: základní zkušenosti s programováním ve kterémkoli programovacím
jazyku (konkrétní kurz programování na MFF se nevyžaduje), středoškolské znalosti mluvnice češtiny.
Literatura
Poslední úprava: ZEMAN/MFF.CUNI.CZ (12.05.2009)

  • James Allen: Natural Language Understanding. The Benjamin/Cummings Publishing Company, Inc.; Redwood City, California,1994. ISBN 0-8053-0334-0.
  • Larry Wall, Tom Christiansen, Randal Schwartz: Programming Perl. O'Reilly, 1996. ISBN 1- 56592-149-6. http://www.perl.com/
  • Adolf Erhart: Základy jazykovědy. Státní pedagogické nakladatelství; Praha, 1990
  • Kimmo Koskenniemi: Two-level Morphology: A General Computational Model for Word-form Recognition and Production. University of Helsinki, Department of General Linguistics, Publications No. 11; Helsinki, 1983
  • Christopher D. Manning, Hinrich Schütze: Foundations of Statistical Natural Language Processing . The MIT Press, Cambridge, Massachusetts, 1999. ISBN 0-26213-360-1.
  • Frederick Jelinek: Statistical Methods for Speech Recognition. The MIT Press, Cambridge, Massachusetts, 1997. ISBN 0-262-10066-5.
Sylabus -
Poslední úprava: ZEMAN/MFF.CUNI.CZ (12.05.2009)

  1. Přehled aplikací počítačové lingvistiky
  2. Programovací jazyk Perl
  3. Korpusy, první aplikace (háčkování, pavouk, hranice slov a vět, rozpoznávání jazyků)
  4. Roviny formálního popisu jazyka. Fonetika (řeč), morfologie, syntax, sémantika.
  5. Vyhodnocování úspěšnosti.
  6. Elektronické slovníky a morfologická analýza. Přehled přístupů k morfologické analýze. Motivace dvouúrovňové morfologie
  7. Dvouúrovňová morfologie, morfonologie
  8. Morfologie a bezkontextové gramatiky
  9. Morfologie a unifikační gramatiky
  10. Zjednoznačnění morfologie (značkování). Ukázka statistických metod při počítačovém zpracování přirozeného jazyka
  11. Syntaktická analýza. Frázový a závislostní model vztahů ve větě. Algoritmy syntaktické analýzy založené na pravidlech.
  12. Nástin statistických přístupů k závislostní syntaktické analýze
 
Univerzita Karlova v Praze | Informační systém UK