PředmětyPředměty(verze: 835)
Předmět, akademický rok 2018/2019
   Přihlásit přes CAS
Lineární regrese - NMSA407
Anglický název: Linear Regression
Zajišťuje: Katedra pravděpodobnosti a matematické statistiky (32-KPMS)
Fakulta: Matematicko-fyzikální fakulta
Platnost: od 2018
Semestr: zimní
E-Kredity: 8
Rozsah, examinace: zimní s.:4/2 Z+Zk [hodiny/týden]
Počet míst: neomezen
Minimální obsazenost: neomezen
Stav předmětu: vyučován
Jazyk výuky: angličtina, čeština
Způsob výuky: prezenční
Další informace: http://msekce.karlin.mff.cuni.cz/~komarek/vyuka/2018_19/nmsa407-2018.html
Garant: doc. RNDr. Arnošt Komárek, Ph.D.
Třída: M Mgr. FPM
M Mgr. FPM > Povinné
M Mgr. PMSE
M Mgr. PMSE > Povinné
Kategorizace předmětu: Matematika > Pravděpodobnost a statistika
Je prerekvizitou pro: NMST432, NMFM404, NMST434, NMST531, NMEK432, NMST431, NMEK450, NMST438, NMST450
Anotace -
Poslední úprava: doc. RNDr. Arnošt Komárek, Ph.D. (25.05.2018)

Lineární regresní model, též bez splnění klasických předpokladů (normalita, konstantní rozptyl, nekorelované chyby), simultánní testování, reziduální analýza a regresní diagnostika.
Cíl předmětu -
Poslední úprava: doc. RNDr. Arnošt Komárek, Ph.D. (25.05.2018)

Naučit studenty modelovat závislost střední hodnoty spojitých náhodných veličin na kvantitativních i kvalitativních proměnných.

Podmínky zakončení předmětu -
Poslední úprava: doc. RNDr. Arnošt Komárek, Ph.D. (25.05.2018)

Předmět je zakončen zápočtem a zkouškou. Konání zkoušky je podmíněno předchozím získáním zápočtu.

Požadavky na zápočet:

  • Domácí úlohy: zapotřebí v termínech specifikovaných vyučujícím odevzdat vypracování 3 úloh. Všechny tři úlohy musejí být vypracovány v dostatečné kvalitě.

  • Písemný test: zapotřebí získat alespoň 60% bodů. Pro tuto část zápočtové povinnosti má každý student k dispozici právě dva termíny v okamžicích specifikovaných vyučujícím. Neúčast na libovolném z těchto dvou termínů (z jakéhokoliv důvodu) nezadává právo na vypsání dalších termínů zápočtové písemky.

Povaha kontroly studia předmětu vylučuje opakování této kontroly.

Literatura
Poslední úprava: doc. RNDr. Arnošt Komárek, Ph.D. (25.05.2018)

Základní
KHURI, A. I. Linear Model Methodology. Chapman & Hall/CRC: Boca Raton, 2010, xx+542 s. ISBN: 978-1-58488-481-1.

ZVÁRA, K. Regrese. Matfyzpress: Praha, 2008, 253 s. ISBN: 978-80-7378-041-8.

Doporučená doplňková
DRAPER, N. R., SMITH, H. Applied Regression Analysis, Third Edition. John Wiley & Sons: New York, 1998, xx+706 s. ISBN: 0-471-17082-8.

SEBER, G. A. F., LEE, A. J. Linear Regression Analysis, Second Edition. John Wiley 7 Sons: Hoboken, 2003, xvi+557 s. ISBN: 0-471-41540-5.

WEISBERG, S. Applied Linear Regression, Third Edition. John Wiley & Sons: Hoboken, 2005, xvi+310 s. ISBN: 0-471-66379-4.

ANDĚL, J. Základy matematické statistiky, druhé opravené vydání. Matfyzpress: Praha, 2007, 358 s. ISBN: 80-7378-001-1.

CIPRA, T. Finanční ekonometrie. Ekopress: Praha, 2008, 538 s. ISBN: 978-80-86929-43-9.

ZVÁRA, K. Regresní analýza. Academia: Praha, 1989, 245 s. ISBN: 80-200-0125-5.

Metody výuky -
Poslední úprava: doc. RNDr. Arnošt Komárek, Ph.D. (25.05.2018)

Přednáška+cvičení.

Požadavky ke zkoušce -
Poslední úprava: doc. RNDr. Arnošt Komárek, Ph.D. (25.05.2018)

Zkouška sestává ze dvou částí

  • písemná část sestávající z teoretických a semi-praktických problémů (bez použití počítače);
  • ústní část sestávající z otázek pokrývajících látku probíranou během přednášek i cvičení.

Problémy zadané u zkoušky vycházejí z odpřednesené látky a současně odpovídají tomu, co bylo procvičováno na cvičení. Zadané problémy odpovídají sylabu předmětu v rozsahu, který byl prezentován na přednášce.

Známka ze zkoušky se stanoví na základě bodového ohodnocení písemné části a hodnocení výkonu u ústní části.

Sylabus -
Poslední úprava: doc. RNDr. Arnošt Komárek, Ph.D. (25.05.2018)

1. Lineární model: projekce a odhady metodou nejmenších čtverců (LSE), Gaussova-Markovova věta, odhadnutelné parametry.

2. Normální lineární model: vlastnosti LSE za normality, testy lineárních hypotéz, intervaly a oblasti spolehlivosti, predikce.

3. Podmodel, testy o podmodelech, koeficient determinace.

4. Obecný lineární model, metoda zobecněných nejmenších čtverců (GLS).

5. Parametrizace kvantitativních a kategoriálních regresorů, interpretace lineárního regresního modelu.

6. Reziduální analýza a regresní diagnostika: reziduální grafy, standardizovaná, studentizovaná a parciální rezidua, vzdálená, odlehlá a vlivná pozorování, vybrané testy o předpokladech lineárního modelu.

7. Následky problematicky zvoleného regresního prostoru, multikolinearita, důsledky chybné specifikace modelu.

8. Strategie budování modelu.

9. Vybrané modely analýzy rozptylu.

10. Simultánní testování: mnohonásobná porovnání, Tukeyova metoda, Hothorn-Bretzova-Wetfallova metoda, pásy spolehlivosti pro regresní funkci.

11. Odhad metodou maximální věrohodnosti (MLE) v normálním lineárním modelu: vlastnosti MLE, souvislost s LSE.

12. Metoda nejmenších čtverců bez splněných klasických předpokladů: asymptotické vlastnosti LSE bez předpokladů normality a homoskedasticity, sandwichový (Whiteův) odhad rozptylu LSE, robustnost klasických intervalů spolehlivosti a testů.

Vstupní požadavky -
Poslední úprava: doc. RNDr. Arnošt Komárek, Ph.D. (25.05.2018)

  • Vektorové prostory, maticový počet;
  • Pravděpodobnostní prostor, podmíněná pravděpodobnost, podmíněné rozdělení, podmíněná střední hodnota;
  • Základní asymptotické výsledky (zákony velkých čísel, centrální limitní věta pro i.i.d. náhodné veličiny a vektory, Cramér-Woldova věta, Cramér-Slutského věta);
  • Základy statistické inference (statistický test, interval spolehlivosti, směrodatná chyba, konzistence);
  • Základní postupy statistické inference (asymptotické testy o střední hodnotě, jedno a dvouvýběrový t-test, analýza rozptylu jednoduchého třídění, chí-kvadrát test nezávislosti);
  • Teorie maximální věrohodnosti včetně asymptotických výsledků a delta metody;
  • Pracovní znalost prostředí R, volně šiřitelného prostředí pro statistické výpočty a grafiku (https://www.r-project.org).

 
Univerzita Karlova | Informační systém UK