PředmětyPředměty(verze: 945)
Předmět, akademický rok 2023/2024
   Přihlásit přes CAS
Biostatistika III – Seminář pokročilých statistických metod - MB120P174
Anglický název: Statistics in Biology III - Seminar on Advanced Statistical Methods
Český název: Biostatistika III – Seminář pokročilých statistických metod
Zajišťuje: Katedra botaniky (31-120)
Fakulta: Přírodovědecká fakulta
Platnost: od 2023
Semestr: letní
E-Kredity: 5
Způsob provedení zkoušky: letní s.:
Rozsah, examinace: letní s.:0/6, Z+Zk [DS]
Počet míst: 20
Minimální obsazenost: 5
4EU+: ne
Virtuální mobilita / počet míst pro virtuální mobilitu: ne
Stav předmětu: nevyučován
Jazyk výuky: čeština
Poznámka: povolen pro zápis po webu
Garant: prof. RNDr. Tomáš Herben, CSc.
Prerekvizity : MB120P163
Výsledky anket   Termíny zkoušek   Rozvrh   
Anotace -
Poslední úprava: RNDr. Zdeněk Janovský, Ph.D. (19.12.2020)
Předmět si klade za cíl seznámit s studenty a naučit je prakticky používat výběr nejčastější pokročilých technik
statistické analysy dat. Předmět je koncipován jako pokračování předmětu Biostatistika a plánování pokusů
(MB120P163), která je prerekvisitou. V odůvodněných případech (např. absolvování analogické přednášky) budou
vyučující ochotni povolit zápis i bez prerekvisity. Předmět bude organisován ve třech dvoudenních blocích
přednášek a cvičení – 1) nenormálně rozdělené závislé proměnné – zobecněné lineární modely (GLM); 2)
hierarchické designy - modely se smíšenými efekty (LME, GLMM) a hierarchické ANOVy (split-plot, nested
ANOVA); 3) modely pracující s časovou, prostorovou či fylogenetickou korelací pozorování závislé proměnné –
metoda zobecněných nejmenších čtverců (GLS, PGLS).
Literatura -
Poslední úprava: RNDr. Zdeněk Janovský, Ph.D. (25.10.2019)

Doporučená literatura:
Crawley, M. J. (2007) The R book. John Wiley & Sons Ltd., Chichester, UK.
Venables, W. N. & Ripley, B. D. (2002) Modern Applied Statistics with S. Springer Verlag, New York, USA.
Fitting Linear Mixed-Effects Models Using lme4 - https://cran.r-project.org/web/packages/lme4/vignettes/lmer.pdf
Pinheiro, J. C. & Bates, D. M. (2000) Mixed-Effects Models in S and S-PLUS. Springer-Verlag, New York, NY, USA.
Zuur, A., Ieno, E.N., Walker, N., Saveliev, A.A., Smith, G.M. (2009): Mixed Effects Models and Extensions in Ecology with R. Springer-Verlag, New York, NY, USA.
Zuur, A., Ieno, E.N., Smith, G.M. (2007) Analysing Ecological Data. Springer-Verlag, New York, NY, USA.
Swenson, N. (2014) Functional and phylogenetic ecology in R. Springer Publishing, New York. 
Paradis, E. (2012) Analysis of phylogenetics and evolution with R. Springer Publishing, New York.

Požadavky ke zkoušce -
Poslední úprava: RNDr. Zdeněk Janovský, Ph.D. (25.10.2019)

Zkouška bude udílena na základě úspěšného vypracování tří klasifikovaných domácích úkolů (vždy po každém bloku přednášky) spočívajících v analyse dohromady 6 datových souborů pomocí vyučovaných statistických technik. Podmínkou pro získání zkoušky je získání alespoň 60 % bodů z domácích úkolů.

Sylabus -
Poslední úprava: RNDr. Zdeněk Janovský, Ph.D. (17.01.2022)

V akad. roce 2021/22 bude kurs vyučován v následujících datech: I. blok (GLM; 31.1. B14, 1.2. B11), III. blok (GLS; 7.-8.2. Seminarium kat. botaniky, BB), II. blok (LMM, GLMM; 16.-17.5. Seminarium kat. botaniky, BB)

 

Rozvržení jednotlivých dvoudenních bloků:

* 1. blok - Zobecněné lineární modely (GLM) a úvod do hierarchických designů
1. den dopoledne
Teorie (cca 2 h) - Úvod do GLM, pojmy deviance, spojovací funkce atd., úvod do logistické regrese
Cvičení (cca 1 h) - logistická regrese, její předpoklady, interpretace, konstrukce konfidečních intervalů logistické křivky

1. den odpoledne
Teorie (cca 1 h) - GLM s binomickým a Poissonovým rozdělením, overdisperse
Cvičení (cca 3 h) - praktické úlohy na poissonovské a binomické GLM, interpretace diagnostických grafů, detekce overdisperse a její vyřešení

2. den dopoledne
Teorie (cca 1 h) - GLM s gama rozdělením, jiné než kanonické spojovací funkce
Cvičení (cca 2 h) - praktické úlohy na GLM z celého spektra doposud probíraných variant

2. den odpoledne
Teorie (cca 1 h) - Hierarchické designy dat a hierarchická ANOVA (split-plot, hierarchická ANOVA s.s.)
Cvičení (cca 1,5 h) - Identifikace jednotlivých hladin hierarchických designů, praktické provedení hierarchických ANOV, pomocné lineární modely pro ověření předpokladů
Teorie (cca 1,5 h) - Opakování konceptu faktorů s náhodným efektem a úvod do lineárních modelů se smíšenými efekty

Domácí úloha: analysa dvou datových souborů zaměřených na použití GLM


* 2. blok - Modely se smíšenými efekty - lineární (LME) i zobecněné lineární (GLMM)
1. den dopoledne
Teorie (cca 1 h) - LME - pokračování, interpretace LME, úvod do testování LME
Cvičení (cca 2 h) - LME s jedním náhodným efektem, úvod do testování faktorů s pevnými efekty, interpretace výsledků LME

1. den odpoledne
Teorie (cca 1 h) - LME - pokračování, rozdíly mezi faktorem s náhodným efektem a faktorem se smíšeným efektem, testování faktorů s náhodným efektem v LME
Cvičení (cca 3 h) - LME s více faktory s náhodnými a smíšenými efekty

2. den dopoledne
Teorie (cca 1 h) - konstrukce konfidenčních intervalů v LME - profilování modelu a jiné metody konstrukce, vyjádření množství vysvětlené variability v rámci LME (pseudo-R2)
Cvičení (cca 2 h) - konstrukce konfidenčních intervalů pro LME, výpočet psuedo-R2

2. den odpoledne
Teorie (cca 1 h) - přechod od LME ke GLMM, obvyklé problémy při práci s modely se smíšenými efekty a jak se s nimi vyrovnat
Cvičení (cca 3 h) - úlohy na GLMM a opakovací úlohy k modelům se smíšenými efekty

Domácí úloha: analysa dvou datových souborů s hierarchickým designem


* 3. blok - Data s časovou, prostorovou či fylogenetickou korelací mezi pozorováními - metoda Generalised Least Squares (GLS)
1. den dopoledne
Teorie (cca 1 h) - Úvod do GLS, možnost využití pro heteroskedastická data, úvod do časové a prostorové autokorelace dat, analysy časových řad, detekce prostorové autokorelace dat (semivariogramy), funkce použitelné k aproximaci semivariogramu
Cvičení (cca 2 h) - GLS s váhami (heteroskedasticita), autoregresivní modely 1. řádu, ARIMA modely, datové soubory s prostorovou autokorelací dat

1. den odpoledne
Teorie (cca 1 h) - Úvod do práce s fylogenetickými daty, modely evoluce znaků, fylogeneticky nezávislé konstrasty (PIC)
Cvičení (cca 3 h) - nahrávání a úpravy dat o fylogenesi, mapování znaků na fylogenetické stromy, analysy datových souborů pomocí PIC

2. den dopoledne
Teorie (cca 1 h) - Fylogenetické GLS (pGLS) a převedení fylogenetického stromu do struktury varianční-kovarianční matice, fylogenetická RMA (reduced major axis regression)
Cvičení (cca 2 h) - analysy datových souborů s dostupnými daty o fylogenesi

2. den odpoledne
Teorie (cca 0,5 h) - Fylogenetická analysa hlavních komponent (phylPCA)
Cvičení (cca 1,5 h) - pokračování úloh z dopoledne + phylPCA
Cvičení (cca 2 h) - diskuse zadání modelových úloh se zaměřením na identifikaci povahy dat a výběr vhodné analytické techniky

Domácí úloha: analysa dvou datových souborů sčasově, prosotorově, nebo fylogeneticky kroelovanými závislými proměnnými

 
Univerzita Karlova | Informační systém UK