Seminar in data analysis - MB120S20
|
|
|
||
Předmět je určen pro studenty magisterského a doktorského studia.
Seminář se začíná ve středu 9.10. v 9,00 ráno v pracovně Tomáše Herbena (Benátská 2, 2. patro). Tam se domluvíme na dalším, např. i přip. přesunu konání. Kurs chceme zaměřit především na složitější jednorozměrné techniky, které nejsou součástí základního statistického kursu (Biostatistika a plánování ekologických pokusů, Janovský et al., MB120P163). Probírané techniky samozřejmě budou záležet hodně na typech dat, které si účastníci přinesou, ale představujeme si zejména tyto skupiny analýz: • data s hierarchicky strukturovanými úrovněmi variability, které je třeba analyzovat různými typy smíšených modelů; • data s korelovanými chybami (prostorová nebo fylogenetická data), které je třeba analyzovat pomocí generalized least squares (GLS); • data, kde závislé proměnné nelze modelovat pomocí normálního rozdělení a je třeba použít zobecněné lineární modely (GLM), nebo zobecněné aditivní modely (GAM); • obecné (nelinearizovatelné) regresní závislosti. V kursu se nechceme věnovat analýze sekvenačních dat a konstrukci fylogenetických stromů (zde odkazujeme na specializované bioinformatické kursy), pokud možno se nechceme věnovat ani datům s mnohorozměrnými závislými proměnnými (které obvykle slouží spíš k vytváření hypotéz než k jejich testování; zde odkazujeme na kurs Biostatistika 2). Kurs bude probíhat seminární formou. Na začátku běhu budou jednotliví účastníci prezentovat, jakou otázku si kladli, cíl, s jakým sbírali data, a popíšou strukturu dat, jež chtějí v kursu analyzovat. Na základě toho rozdělíme data (a jejich majitele) do skupin s podobnou strukturou dat. V následující části kursu budeme postupně procházet jednotlivé typy datových struktur a praktikovým způsobem zkoumat možnosti jejich analýzy, společně je analyzovat a interpretovat získané výsledky. Podmínkou účasti v kursu jsou nasbíraná a uspořádaná data pro analýzu a dobrá otázka, kterou je možno těmito daty zodpovědět. Kurs bude probíhat v prostředí jazyka R, čili také předpokládáme alespoň základní znalost tohoto jazyka a prostředí. Last update: Herben Tomáš, prof. RNDr., CSc. (30.09.2024)
|
|
||
Zuur, Alain F. et al. (2009) Mixed Effects Models and Extensions in Ecology With R. New York, NY, Springer. Crawley M.J. (2007) The R Book. Wiley. Venables W. N. and Ripley B. D. (2002) Modern Applied Statistics with S. Springer Last update: Štefánek Michal, Mgr. (17.05.2023)
|