PředmětyPředměty(verze: 945)
Předmět, akademický rok 2023/2024
   Přihlásit přes CAS
Základy analýzy dat - NMMB333
Anglický název: Introduction to data analysis
Zajišťuje: Katedra algebry (32-KA)
Fakulta: Matematicko-fyzikální fakulta
Platnost: od 2020
Semestr: zimní
E-Kredity: 5
Rozsah, examinace: zimní s.:2/2, Z+Zk [HT]
Počet míst: neomezen
Minimální obsazenost: neomezen
4EU+: ne
Virtuální mobilita / počet míst pro virtuální mobilitu: ne
Stav předmětu: vyučován
Jazyk výuky: čeština
Způsob výuky: prezenční
Způsob výuky: prezenční
Garant: RNDr. Pavel Charamza, CSc.
Třída: M Mgr. MMIB
M Mgr. MMIB > Povinně volitelné
Kategorizace předmětu: Matematika > Matematika, Algebra, Diferenciální rovnice, teorie potenciálu, Didaktika matematiky, Diskrétní matematika, Matematická ekonomie a ekonometrie, Předměty širšího základu, Finanční a pojistná matematika, Funkční analýza, Geometrie, Předměty obecného základu, , Reálná a komplexní analýza, Matematika, Matematické modelování ve fyzice, Numerická analýza, Optimalizace, Pravděpodobnost a statistika, Topologie a kategorie
Anotace -
Poslední úprava: doc. Mgr. et Mgr. Jan Žemlička, Ph.D. (09.05.2018)
Kurz je zaměřen na standardní metody analýzy dat včetně moderních trendů zpracování velkých datových souborů metodami strojového učení. Modelování nad reálnými daty v prostředí jazyka R.
Podmínky zakončení předmětu -
Poslední úprava: doc. Mgr. et Mgr. Jan Žemlička, Ph.D. (10.06.2019)

Předmět je zakončen ústní zkouškou.

Literatura -
Poslední úprava: doc. Mgr. et Mgr. Jan Žemlička, Ph.D. (09.05.2018)

Zvára Karel: Regresní analýza, Academia 1989

Hebák, Hustopecký: Vícerozměrné statistické metody 1, 2, 3, Informatorium, 2007

Kolaczyk, Csardi: Statistical Analysis of Network Data with R, Springer, 2014

Munzert, Rubba, Meissner, Nyhuis: Automated Data Collection with R, Wiley, 2015

Požadavky ke zkoušce -
Poslední úprava: doc. Mgr. et Mgr. Jan Žemlička, Ph.D. (10.06.2019)

Zkouška má ústní formu. Její požadavky odpovídají obsahu přednesené látky.

Sylabus -
Poslední úprava: doc. Mgr. et Mgr. Jan Žemlička, Ph.D. (09.05.2018)

1) Základy lineární regrese, logistické regrese, lasso regrese, hřebenové regrese, principy testování hypotéz, test podílem věrohodností, stepwise algoritmy

2) Základy vícerozměrné statistiky - metoda hlavních komponent, faktorová analýza, shluková analýza

3) Míry diskriminace - Kolmogorov Smirnov, Gini koeficient, Somer’s d

4) Principy back testu, cross validace a bootstrappingu

5) Regresní stromy, náhodné lesy

6) Gradient boosting

7) Bayesovské sítě, neuronové sítě

8) Lineární optimalizace, Support vector machine

Cvičení: Základy programování v prostředí R, praktické ukázky práce s daty

 
Univerzita Karlova | Informační systém UK