PředmětyPředměty(verze: 845)
Předmět, akademický rok 2018/2019
   Přihlásit přes CAS
Praktické základy pravděpodobnosti a statistiky pro komputační lingvistiku - NPFL081
Anglický název: Practical Fundamentals of Probability and Statistics for Computer Linguistics
Zajišťuje: Ústav formální a aplikované lingvistiky (32-UFAL)
Fakulta: Matematicko-fyzikální fakulta
Platnost: od 2017
Semestr: zimní
E-Kredity: 3
Rozsah, examinace: zimní s.:0/2 Z [hodiny/týden]
Počet míst: neomezen
Minimální obsazenost: neomezen
Stav předmětu: vyučován
Jazyk výuky: angličtina
Způsob výuky: prezenční
Další informace: http://ufal.ms.mff.cuni.cz/courses/pfl081
Garant: RNDr. Martin Holub, Ph.D.
Třída: Informatika Mgr. - volitelný
Kategorizace předmětu: Informatika > Počítačová a formální lingvistika
Anotace -
Poslední úprava: SLEZA (22.05.2007)
Předmět je určen POUZE pro studenty v Programu EM LCT, viz http://ufal.mff.cuni.cz/lct.html. Cílem semináře je představit základní pravděpodobnostní a statistické principy, postupy a metody, které se prakticky využívají při řešení úloh komputační lingvistiky (zpracování přirozeného jazyka). Podstatnou částí kurzu je aktivní práce s daty a seznámení s postupy pro vypracování úloh v R. Po dohodě může část semináře proběhnout čtením a studiem vybraných materiálů.
Podmínky zakončení předmětu - angličtina
Poslední úprava: RNDr. Martin Holub, Ph.D. (15.10.2017)

Students should regularly attend the classes and pass two written tests during the term and/or an assignement of a given task in R. Both theoretical knowledge and practical skills will be tested.

Literatura - angličtina
Poslední úprava: RNDr. Martin Holub, Ph.D. (15.10.2017)

Sheldon M. Ross: A First Course In Probability. (7th Ed.) Prentice Hall, 2005.

Gonick, Larry and Woollcott Smith. The Cartoon Guide to Statistics. Harper Resource. 2005.

Sylabus -
Poslední úprava: RNDr. Martin Holub, Ph.D. (15.10.2017)
  • matematická pravděpodobnost, definice a její počítání, Bayesův vztah
  • náhodná veličina (diskrétní i spojité) a její pravděpodobnostní rozdělení
  • distribuční a kvantilová funkce, hustota
  • statistická nezávislost
  • střední hodnota a rozptyl
  • vlastnosti binomického a normálního rozdělení
  • náhodný výběr
  • parametry rozdělení, odhadování parametrů, t-test
  • statistické testování hypotéz, kritické hodnoty
  • kontingenční tabulky a testy v kontingenčních tabulkách
  • chi-kvadrát rozdělení a testy na něm založené
  • entropie, podmíněná entropie, vzájemná informace
  • základy programování v systému R (www.r-project.org)

 
Univerzita Karlova | Informační systém UK