PředmětyPředměty(verze: 945)
Předmět, akademický rok 2023/2024
   Přihlásit přes CAS
Pokročilá analýza sociálněvědních dat v R - ASGV10012
Anglický název: Advanced analysis of social science data in R
Zajišťuje: Katedra sociologie (21-KSOC)
Fakulta: Filozofická fakulta
Platnost: od 2023
Semestr: zimní
Body: 0
E-Kredity: 4
Způsob provedení zkoušky: zimní s.:
Rozsah, examinace: zimní s.:1/2, Z [HT]
Počet míst: neomezen / neurčen (neurčen)
Minimální obsazenost: neomezen
4EU+: ne
Virtuální mobilita / počet míst pro virtuální mobilitu: ne
Kompetence:  
Stav předmětu: vyučován
Jazyk výuky: čeština
Způsob výuky: prezenční
Způsob výuky: prezenční
Úroveň:  
Poznámka: předmět je možno zapsat mimo plán
povolen pro zápis po webu
Garant: Mgr. Aleš Vomáčka
Vyučující: Mgr. Aleš Vomáčka
Anotace -
Poslední úprava: Mgr. Aleš Vomáčka (20.09.2023)
Jak se odhadují dopady vzdělávacích programů? Vliv kouření na riziko výskytu rakoviny? A jak se zkoumá, jestli má zvýšení minimální mzdy dopad na nezaměstnanost?

Cílem tohoto kurzu je pomocí těchto a dalších příkladů uvést studenty do světa kauzální inference a pokročilého statistického modelování. Kurz samotný je rozdělen do dvou části. V první části si ukážeme, jak modelovat proměnné, na které nestačí lineární regrese. V druhé části si představíme základy kauzální inference - nástrojů pro zkoumání vlivu proměnných, namísto prostých korelací. Konkrétně nás čeká:

1. část:

* Úvod do zobecněných lineárních modelů<br>
* Modelování kategoriálních proměnných, jako je volební účast nebo voličské preference (logistická regrese)
* Modelování četností, jako je počet zameškaných hodin ve škole (Poissonovská Negativně-binomická regrese)
* Modelování proměnných v uzavřeném intervalů, jako je školní průměr nebo podíly (beta a gamma regrese)

2. část

* Uvedení do kauzální inference<br>
* Experimentální design, využívány při evaluaci vzdělávacích politik i v marketingu
* Difference-in-differences analýza, aneb je se zkoumal vliv minimální mzdy na nezaměstnanost
* Propensity score matching/weighting a jak jej epidemiologové využívají pro zkoumání dopadů kouření nebo nošení roušek.
<br>
<br>
Po absolvování kurzu budou studenti připraveni pustit se do kvantitativní analýzy na expertní úrovni, ať už se vydají cestou akademie, soukromého sektoru nebo veřejné politiky. Kurz předpokládá uživatelskou znalost programovacího jazyka R (na úrovni kurzu Úvod do analýzy dat v R) a schopnost využívat lineární regresi (na úrovni kurzu Aplikovaná regrese v R). Studenti také budou potřebovat vlastní notebook.
Cíl předmětu -
Poslední úprava: Mgr. Aleš Vomáčka (20.09.2023)

Po absolvování kurzu budou studenti schopní a) vytvořit regresní model pro analýzu naprosté většiny proměnných, se kterými se v praxi setkají a b) navrhnout strategii pro zkoumání kauzálních vztahů a provést analýzu.

Podmínky zakončení předmětu -
Poslední úprava: Mgr. Aleš Vomáčka (20.09.2023)

Pro úspěšné zakončení předmětu studenti vypracují report, v rámci kterého provedou analýzy dat za pomocí technik vyučovaných v tomto kurzu. Zdrojem dat může být buď projekt Tidytuesday (https://github.com/rfordatascience/tidytuesday), případně po konzultaci mohou studenti využít i svá vlastní data (např. do bakalářské/diplomové práce) 

Literatura -
Poslední úprava: Mgr. Aleš Vomáčka (20.09.2023)

* Gelman, A., Hill, J., & Vehtari, A. (2021). Regression and other stories. Cambridge University Press. Dostupná online na https://avehtari.github.io/ROS-Examples/

* McElreath, R. (2015). Statistical Rethinking: A Bayesian Course with Examples in R and Stan (1st edition). Chapman and Hall/CRC.

* Huntington-Klein, N. (n.d.). The Effect: An Introduction to Research Design and Causality | The Effect. Retrieved 20 September 2023, Dostupné online na  https://theeffectbook.net/

* Cunningham, S. (2021). Causal Inference: The Mixtape. Yale University Press. Dostupné online na https://mixtape.scunning.com/

 
Univerzita Karlova | Informační systém UK