Poslední úprava: doc. Mgr. et Mgr. Jan Žemlička, Ph.D. (09.05.2018)
Kurz je zaměřen na standardní metody analýzy dat včetně moderních trendů zpracování velkých datových
souborů metodami strojového učení. Modelování nad reálnými daty v prostředí jazyka R.
Poslední úprava: doc. Mgr. et Mgr. Jan Žemlička, Ph.D. (09.05.2018)
The lecture covers standard methods of data analysis, including modern
trends of big data analysis using machine learning. Modelling over real
data in the R environment.
Podmínky zakončení předmětu -
Poslední úprava: doc. Mgr. et Mgr. Jan Žemlička, Ph.D. (10.06.2019)
Předmět je zakončen ústní zkouškou.
Poslední úprava: doc. Mgr. et Mgr. Jan Žemlička, Ph.D. (28.10.2019)
Students have to pass oral exam.
Literatura -
Poslední úprava: doc. Mgr. et Mgr. Jan Žemlička, Ph.D. (09.05.2018)
Zvára Karel: Regresní analýza, Academia 1989
Hebák, Hustopecký: Vícerozměrné statistické metody 1, 2, 3, Informatorium, 2007
Kolaczyk, Csardi: Statistical Analysis of Network Data with R, Springer, 2014
Munzert, Rubba, Meissner, Nyhuis: Automated Data Collection with R, Wiley, 2015
Poslední úprava: doc. Mgr. et Mgr. Jan Žemlička, Ph.D. (09.05.2018)
Zvára Karel: Regresní analýza, Academia 1989
Hebák, Hustopecký: Vícerozměrné statistické metody 1, 2, 3, Informatorium, 2007
Kolaczyk, Csardi: Statistical Analysis of Network Data with R, Springer, 2014
Munzert, Rubba, Meissner, Nyhuis: Automated Data Collection with R, Wiley, 2015
Požadavky ke zkoušce -
Poslední úprava: doc. Mgr. et Mgr. Jan Žemlička, Ph.D. (10.06.2019)
Zkouška má ústní formu. Její požadavky odpovídají obsahu přednesené látky.
Poslední úprava: doc. Mgr. et Mgr. Jan Žemlička, Ph.D. (28.10.2019)
Students have to pass oral exam. The requirements for the exam correspond to what has been done during lectures and practicals.
Sylabus -
Poslední úprava: doc. Mgr. et Mgr. Jan Žemlička, Ph.D. (09.05.2018)
1) Základy lineární regrese, logistické regrese, lasso regrese, hřebenové regrese, principy testování hypotéz, test podílem věrohodností, stepwise algoritmy
2) Základy vícerozměrné statistiky - metoda hlavních komponent, faktorová analýza, shluková analýza
3) Míry diskriminace - Kolmogorov Smirnov, Gini koeficient, Somer’s d
4) Principy back testu, cross validace a bootstrappingu
5) Regresní stromy, náhodné lesy
6) Gradient boosting
7) Bayesovské sítě, neuronové sítě
8) Lineární optimalizace, Support vector machine
Cvičení: Základy programování v prostředí R, praktické ukázky práce s daty
Poslední úprava: doc. Mgr. et Mgr. Jan Žemlička, Ph.D. (09.05.2018)
1) Basics of linear regression, logistic regression, lasso regression, principles of hypotheses testing, likelihood ratio tests, stepwise algorithms