Jak se odhadují dopady vzdělávacích programů? Vliv kouření na riziko výskytu rakoviny? A jak se zkoumá, jestli má zvýšení minimální mzdy dopad na nezaměstnanost?
Cílem tohoto kurzu je pomocí těchto a dalších příkladů uvést studenty do světa kauzální inference a pokročilého statistického modelování. Kurz samotný je rozdělen do dvou části. V první části si ukážeme, jak modelovat proměnné, na které nestačí lineární regrese. V druhé části si představíme základy kauzální inference - nástrojů pro zkoumání vlivu proměnných, namísto prostých korelací. Konkrétně nás čeká:
1. část:
* Úvod do zobecněných lineárních modelů<br>
* Modelování kategoriálních proměnných, jako je volební účast nebo voličské preference (logistická regrese)
* Modelování četností, jako je počet zameškaných hodin ve škole (Poissonovská Negativně-binomická regrese)
* Modelování proměnných v uzavřeném intervalů, jako je školní průměr nebo podíly (beta a gamma regrese)
2. část
* Uvedení do kauzální inference<br>
* Experimentální design, využívány při evaluaci vzdělávacích politik i v marketingu
* Difference-in-differences analýza, aneb je se zkoumal vliv minimální mzdy na nezaměstnanost
* Propensity score matching/weighting a jak jej epidemiologové využívají pro zkoumání dopadů kouření nebo nošení roušek.
<br>
<br>
Po absolvování kurzu budou studenti připraveni pustit se do kvantitativní analýzy na expertní úrovni, ať už se vydají cestou akademie, soukromého sektoru nebo veřejné politiky. Kurz předpokládá uživatelskou znalost programovacího jazyka R (na úrovni kurzu Úvod do analýzy dat v R) a schopnost využívat lineární regresi (na úrovni kurzu Aplikovaná regrese v R). Studenti také budou potřebovat vlastní notebook.
Poslední úprava: Vomáčka Aleš, Mgr. (20.09.2023)
How do you estimate the impact of education policies? Or influence of smoking on the risk of cancer? And how would we examine whether raising the minimum wage has an impact on unemployment?
Using these and other examples, this course aims to introduce students to the world of causal inference and advanced statistical modelling. The course itself is divided into two parts. In the first part, we will show how to model variables for which linear regression is not sufficient. In the second part, we'll review the basics of causal inference - tools for examining the influence of variables instead of simple correlations. Specifically, we will:
Part 1:
* Introduction to Generalized Linear Models
* Modelling categorical variables such as voter turnout or political preferences (logistic regression)
* Modelling count variables such as the number of hours missed at school (Poisson Negative Binomial Regression)
* Modelling variables in closed intervals, such as school grade average or proportions (beta and gamma regression)
Part 2:
* Introduction to causal inference
* Experimental design, used in the evaluation of educational policies and in marketing
* Difference-in-differences analysis, or how we researched the effect of raising the minimum wage on unemployment
* Propensity score matching/weighting, and how epidemiologists use it to study the effects of smoking or wearing medical masks.
Upon completion of the course, students will be ready to embark on quantitative analysis at the expert level, whether they take the path of academia, the private sector or public policy. The course assumes user proficiency in the R programming language (at the level of the Introduction to Data Analysis in R course) and the ability to use linear regression (at the level of the Applied Regression in R course). Students will also need their own laptop.
Poslední úprava: Vomáčka Aleš, Mgr. (21.09.2023)
Cíl předmětu -
Po absolvování kurzu budou studenti schopní a) vytvořit regresní model pro analýzu naprosté většiny proměnných, se kterými se v praxi setkají a b) navrhnout strategii pro zkoumání kauzálních vztahů a provést analýzu.
Poslední úprava: Vomáčka Aleš, Mgr. (20.09.2023)
Upon completion of the course, students will be able to a) create a regression model to analyze the vast majority of variables they will encounter in practice and b) design a strategy for exploring causal relationships and perform the analysis.
Poslední úprava: Vomáčka Aleš, Mgr. (21.09.2023)
Podmínky zakončení předmětu -
Pro úspěšné zakončení předmětu studenti vypracují report, v rámci kterého provedou analýzy dat za pomocí technik vyučovaných v tomto kurzu. Zdrojem dat může být buď projekt Tidytuesday (https://github.com/rfordatascience/tidytuesday), případně po konzultaci mohou studenti využít i svá vlastní data (např. do bakalářské/diplomové práce)
Poslední úprava: Vomáčka Aleš, Mgr. (20.09.2023)
To successfully complete this course, students will produce a report in which they perform data analysis using the techniques taught in this course. The source of data can be either the Tidytuesday project (https://github.com/rfordatascience/tidytuesday) or, after consultation, students can use their own data (e.g. for a bachelor's/diploma thesis)
Poslední úprava: Vomáčka Aleš, Mgr. (21.09.2023)
Literatura -
* Gelman, A., Hill, J., & Vehtari, A. (2021). Regression and other stories. Cambridge University Press. Dostupná online na https://avehtari.github.io/ROS-Examples/
* McElreath, R. (2015). Statistical Rethinking: A Bayesian Course with Examples in R and Stan (1st edition). Chapman and Hall/CRC.
* Huntington-Klein, N. (n.d.). The Effect: An Introduction to Research Design and Causality | The Effect. Retrieved 20 September 2023, Dostupné online na https://theeffectbook.net/
* Cunningham, S. (2021). Causal Inference: The Mixtape. Yale University Press. Dostupné online na https://mixtape.scunning.com/
Poslední úprava: Vomáčka Aleš, Mgr. (20.09.2023)
* Gelman, A., Hill, J., & Vehtari, A. (2021). Regression and other stories. Cambridge University Press. Available online at https://avehtari.github.io/ROS-Examples/
* McElreath, R. (2015). Statistical Rethinking: A Bayesian Course with Examples in R and Stan (1st edition). Chapman and Hall/CRC.
* Huntington-Klein, N. (n.d.). The Effect: An Introduction to Research Design and Causality | The Effect. Retrieved 20 September 2023, Available online at https://theeffectbook.net/
* Cunningham, S. (2021). Causal Inference: The Mixtape. Yale University Press. Available online at https://mixtape.scunning.com/