PředmětyPředměty(verze: 845)
Předmět, akademický rok 2018/2019
   Přihlásit přes CAS
Výpočetní prostředí pro statistickou analýzu dat - NMST440
Anglický název: Computational Environment for Statistical Data Analysis
Zajišťuje: Katedra pravděpodobnosti a matematické statistiky (32-KPMS)
Fakulta: Matematicko-fyzikální fakulta
Platnost: od 2018 do 2019
Semestr: letní
E-Kredity: 4
Rozsah, examinace: letní s.:0/2 Z [hodiny/týden]
Počet míst: neomezen
Minimální obsazenost: neomezen
Stav předmětu: vyučován
Jazyk výuky: angličtina, čeština
Způsob výuky: prezenční
Další informace: http://msekce.karlin.mff.cuni.cz/~komarek/vyuka/nmst440.html
Garant: doc. RNDr. Arnošt Komárek, Ph.D.
Třída: M Mgr. PMSE
M Mgr. PMSE > Povinně volitelné
Kategorizace předmětu: Informatika > Aplikační software
Matematika > Pravděpodobnost a statistika
Anotace -
Poslední úprava: T_KPMS (30.05.2016)
Pokročilé aspekty systému R, volně dostupného výpočetního prostředí pro statistické výpočty a grafiku, základy html, základy programování v jazyce C, využití výpočetních clusterů pro náročné výpočty, přehled komerčních produktů pro statistickou analýzu dat.
Cíl předmětu -
Poslední úprava: doc. RNDr. Arnošt Komárek, Ph.D. (19.05.2016)

Naučit studenty efektivně využívat pokročilých nástrojů systému R, volně dostupného výpočetního prostředí pro statistické výpočty a grafiku, souvisejících open-source softwarových produktů a dalších vybraných výpočetních prostředků. Podat přehled o vybraných komerčních produktech užívaných ke statistické analýze dat.

Podmínky zakončení předmětu -
Poslední úprava: doc. RNDr. Arnošt Komárek, Ph.D. (06.02.2018)

Zápočet bude udělen studentovi, který uspokojivě a v termínu vyřeší zadání všech úloh zadaných během semestru. Povaha těchto požadavků vylučuje možnost opakovaných pokusů o zápočet.

Literatura
Poslední úprava: doc. RNDr. Arnošt Komárek, Ph.D. (19.05.2016)

Chambers, J. M. Software for Data Analysis: Programming with R. New York: Springer-Verlag, 2008, xiv + 500 s. ISBN: 978-0-387-75935-7.

Murrell, P. R Graphics, Second Edition. Boca Raton: Chapman & Hall/CRC, 2012, xxvii + 518 s. ISBN: 978-1-4398-3177-9.

Metody výuky -
Poslední úprava: doc. RNDr. Arnošt Komárek, Ph.D. (19.05.2016)

Seminář + samostatná práce s možností konzultací.

Sylabus -
Poslední úprava: doc. RNDr. Arnošt Komárek, Ph.D. (12.04.2018)

1. Základy html, prezentace na webu.

2. R programování (funkce, vektorizované operace, ...).

3. Pokročilá grafika v R (lattice, ggplot2, ...).

4. Automatizovaná tvorba výstupů a prezentace výsledků pomocí R, systémy pro tvorbu výstupů a prezentací (Sweave, markdown, shiny).

5. Základy programovacího jazyka C, využití pro náročné výpočty ve spojení se systémem R.

6. Využití výpočetních clusterů pro náročné výpočty.

7. Přehledová informace o vybraných komerčních produktech pro statistickou analýzu dat (SAS, TIBCO Statistica, IBM SPSS, ...).

Vstupní požadavky -
Poslední úprava: doc. RNDr. Arnošt Komárek, Ph.D. (25.05.2018)
  • Základy statistické inference (statistický test, interval spolehlivosti, směrodatná chyba, konzistence);
  • Základní postupy statistické inference (asymptotické testy o střední hodnotě, jedno a dvouvýběrový t-test, analýza rozptylu jednoduchého třídění, chí-kvadrát test nezávislosti);
  • Lineární model;
  • Středně pokročilá znalost prostředí R, volně šiřitelného prostředí pro statistické výpočty a grafiku (https://www.r-project.org);
  • Pracovní znalost systému LaTeX;
  • Schopnost algoritmického programování (v libovolném jazyce, např. Python, Pascal, C/C++, Fortran, ...).

 
Univerzita Karlova | Informační systém UK