PředmětyPředměty(verze: 945)
Předmět, akademický rok 2023/2024
   Přihlásit přes CAS
Aplikovaná regrese v R - ASGV01002
Anglický název: Applied regression in R
Zajišťuje: Katedra sociologie (21-KSOC)
Fakulta: Filozofická fakulta
Platnost: od 2023 do 2023
Semestr: letní
Body: 0
E-Kredity: 3
Způsob provedení zkoušky: letní s.:
Rozsah, examinace: letní s.:2/0, Z [HT]
Počet míst: neomezen / neurčen (neurčen)
Minimální obsazenost: neomezen
4EU+: ne
Virtuální mobilita / počet míst pro virtuální mobilitu: ne
Kompetence:  
Stav předmětu: vyučován
Jazyk výuky: čeština
Způsob výuky: prezenční
Způsob výuky: prezenční
Úroveň:  
Poznámka: předmět je možno zapsat mimo plán
povolen pro zápis po webu
Garant: Mgr. Aleš Vomáčka
Vyučující: Mgr. Aleš Vomáčka
Anotace -
Poslední úprava: Mgr. Aleš Vomáčka (08.02.2024)
Cílem toho kurzu je seznámit studenty s lineární regresní analýzou s důrazem na aplikaci v programovacím jazyce R. Důraz je kladen primárně na konceptuální pochopení statistického modelování, intuitivní interpretaci/vizualizaci výsledků a hodnocení kvality analýzy. V první polovině kurzu se seznámíme s nástroji pro vytváření a interpretaci regresních modelů. V druhé části kurzu si popovídáme o tom, jaké předpoklady lineární regrese dělá, k čemu jsou a co dělat, když je náš model nesplňuje. Kromě dobré praxe si ukážeme také časté chyby a jak se jim vyhnout.

Absolventi kurzu budou schopní provést statistickou analýzu pomocí lineární regrese od začátku do konce - od výběru proměnných k analýze, přes vytvoření a kontrolu modelu, až po jeho interpretaci a vizualizaci. Především ale získají znalosti nezbytné k obhájení rozhodnutí, které v rámci statistické analýzy dat dělají. Nejen, že budou schopni obhájit závěry svých analýz před publikem, ale zvýší (snad) i důvěru ve své vlastní analytické schopnosti.

Kurz předpokládá základní znalosti statistiky (na úrovni kurzu Statistika 2) a programovacího jazyka R (na úrovni Úvodu do analýzy dat v R).
Podmínky zakončení předmětu -
Poslední úprava: Mgr. Petra Poncarová (18.05.2023)

K úspěšnému absolvování tohoto kurzu jsou studenti povinni udělat následující:

Vybrat datový soubor uvedený v projektu TidyTuesday (libovolný rok).


Formulovat výzkumný problém související s daty. Tento výzkumný problém může být buď prediktivní, nebo inferenční povahy (např. Můžeme predikovat popularitu písně na Spotify na základě jejích charakteristik? Závisí rozdíl ve mzdách mužů a žen v USA na podílu žen v oboru? Jsou dražší videohry hodnoceny lépe?).


Analyzujte data pomocí lineárního regresního modelu a napište zprávu o svých zjištěních. Tato zpráva by měla obsahovat jasnou definici vašich výzkumných problémů, popis vašich dat (včetně popisné statistiky), popis vašeho regresního modelu (případně jak tabulek, tak grafů), diagnostiku vašeho regresního modelu a celkový závěr. Data můžete transformovat a filtrovat podle potřeby, ale jasně popsat všechny datové transformace.


Připravte si dva dokumenty k odevzdání: (1) skript, který musí být plně funkční: musí běžet bez chyb od začátku (včetně stahování dat z webu TidyTuesday), dokončit bez potřeby vnějších zásahů a vytvořit všechny analytické výstupy (modely, grafy) použité pro zadání, (2) závěrečnou zprávu (např. Word nebo Pdf) jak je popsáno výše.


Oba dokumenty zašlete na emailovou adresu, kterou vám sdělíme na kurzu. Termín bude také sdělen na kurzu. Pokud se zaseknete, nebojte se požádat o konzultaci.

Literatura
Poslední úprava: Mgr. Petra Poncarová (18.05.2023)

Primary literature

Secondary literature

  • Cole, S. R., Platt, R. W., Schisterman, E. F., Chu, H., Westreich, D., Richardson, D., & Poole, C. (2010). Illustrating bias due to conditioning on a collider. International Journal of Epidemiology, 39(2), 417–420. https://doi.org/10.1093/ije/dyp334
  • Cook, R. D. (1977). Detection of Influential Observation in Linear Regression. Technometrics, 19(1), 15–18. https://doi.org/10.2307/1268249
  • Fox, J. (2015). Applied Regression Analysis and Generalized Linear Models (Third edition). SAGE Publications, Inc.
  • Greenland, S., Senn, S. J., Rothman, K. J., Carlin, J. B., Poole, C., Goodman, S. N., & Altman, D. G. (2016). Statistical tests, P values, confidence intervals, and power: A guide to misinterpretations. European Journal of Epidemiology, 31(4), 337–350. https://doi.org/10.1007/s10654-016-0149-3
  • King, G., & Roberts, M. E. (2015). How Robust Standard Errors Expose Methodological Problems They Do Not Fix, and What to Do About It. Political Analysis, 23(2), 159–179.
  • Shmueli, G. (2010). To Explain or To Predict? (SSRN Scholarly Paper ID 1351252). Social Science Research Network. https://doi.org/10.2139/ssrn.1351252
 
Univerzita Karlova | Informační systém UK