Poslední úprava: Mgr. Jaromír Mazák, Ph.D. (28.01.2021)
Kurz seznámí studenty s metodou lineární regresní analýzy s důrazem na aplikované využití v softwaru R. Design kurzu se zaměřuje na studenty společenskovědních oborů, což se projevuje v jeho zacílení na koncepční pochopení lineární regrese a praktické aplikace ve společenských vědách. Kurz obsahuje jen velmi málo matematiky, ale pro zájemce odkazujeme u jednotlivých témat i na literaturu s techničtějším/matematickým pojednáním. Po absolvování kurzu by studenti měli mít dobré koncepční pochopení lineární regrese a rozmanitých účelů, ke kterým se používá (deskripce, inference ze vzorku na populaci, kauzální inference, predikce), měli by ovládat běžnou terminologii, rozumět předpokladům spojený s regresním modelováním, být schopni je ověřit a adekvátně reagovat v případě jejich porušení. Především by ale měli být schopni udělat dobře vyargumentovaná rozhodnutí při realizaci vlastní analýzy a výsledky analýzy by měli být schopni správně prezentovat a interpretovat.
Poslední úprava: Mgr. Jaromír Mazák, Ph.D. (28.01.2021)
The course will introduce students to linear regression analysis with emphasis on applied applications in R software. The course is designed for social science students, which is reflected in its focus on a conceptual understanding of linear regression and practical applications in the social sciences. The course contains very little mathematics, but for those interested we refer also to literature with more technical/mathematical treatment of topics covered. After completing the course, students should have a good conceptual understanding of linear regression and the diverse purposes for which it is used (deskription, sample-to-population inference, causal inference, prediction), should command common terminology, understand assumptions associated with regression modelling, be able to verify them and respond adequately in the event of a breach of assumptions. Above all, though, they should be able to make well-argued decisions when conducting their own regression analysis, and they should be able to present and interpret the results of the analysis correctly.
Podmínky zakončení předmětu -
Poslední úprava: Mgr. Jaromír Mazák, Ph.D. (08.02.2021)
Pro úspěšné splnění předmětu je nutné splnit následující úkol:
Odevzdat do konce zkouškového období v semestru, ve kterém byl předmět zapsán, semestrální úkol, jehož přesné parametry budou pro daný akademický rok upřesněny vždy na začátku kurzu. V každém případě je vždy potřeba odevzdat skript, který musí být plně funkční, tedy musí proběhnout bez chyby od začátku do konce bez vnějších zásahů, a který generuje všechny analytické výstupy v úkolu, a také finální dokument z okomentovanou analýzou (např. Word nebo Pdf, kde jsou analytické závěry doprovozené úvodem, výzkumnou otázkou, diskusí předpokladů, interpretacemi analýz a shrnutím výsledků).
Poslední úprava: Mgr. Jaromír Mazák, Ph.D. (08.02.2021)
To successfully complete the subject, the following task is required:
Students need to submit an assignment by the end of the examination period in the semester in which the subject was enrolled. The exact parameters of the assignment will be specified at the beginning of the course and may be slightly different in each academic year. The general rule is that students need to hand in two documents: (1) a script which must be fully operational: it has to run without error from start to finish without any need for outside interference and produce all analytical outputs (models, charts) used for the assignment, (2) final document (e.g. Word or Pdf) where analytical outputs are accompanied by an introduction, statement of a research question, discussion of assumptions, interpretations of analyses, and a summary of results.
Literatura -
Poslední úprava: Mgr. Jaromír Mazák, Ph.D. (28.01.2021)
Hlavní učebnice ke kurzu:
Gelman, A., Hill, J., & Vehtari, A. (2020). Regression and Other Stories. Cambridge University Press. Doi: 10.1017/9781139161879
Harrell, F. (2001). Regression Modeling Strategies: With Applications to Linear Models, Logistic Regression, and Survival Analysis. Springer-Verlag.Doi: 10.1007/978-1-4757-3462-1
Doplňková literatura bude představena v průběhu kurzu.
Poslední úprava: Mgr. Jaromír Mazák, Ph.D. (28.01.2021)
Main literature:
Gelman, A., Hill, J., & Vehtari, A. (2020). Regression and Other Stories. Cambridge University Press. Doi: 10.1017/9781139161879
Harrell, F. (2001). Regression Modeling Strategies: With Applications to Linear Models, Logistic Regression, and Survival Analysis. Springer-Verlag.Doi: 10.1007/978-1-4757-3462-1
Supplementary literature will be presented throughout the course.
Metody výuky - angličtina
Poslední úprava: Mgr. Jaromír Mazák, Ph.D. (03.02.2021)
Course Implementation in case of Distance Teaching/Learning
The lessons will be conducted online according to the time schedule published on the webpage of the Department of Sociology
Online learning platform: Zoom (enrolled students will receive the link short before the first session)
Study materials: dedicated web page: https://sociology-fa-cu.github.io/appliedregressioninr/index.html
Requirements to pass the course: same as under normal conditions
Vstupní požadavky -
Poslední úprava: Mgr. Jaromír Mazák, Ph.D. (06.02.2021)
Formálně nejsou nastaveny žádné prerekvizity, protože chceme zachovat kurz inkluzivní pro lidi z růtných oborů a fakult a také pro studenty ze zahraničí. Nicméně kurz předpokládá základní znalost statistiky (přibližně na úrovni dvou semestrů, jak standardně vyučovány na Katedře sociologie FF UK). Výhodou je také znalost prostředí R. Nejlepší je jako první absolvovat náš kurz Úvod do analýzy dat v R (ASGV00154) nebo jiný semestrální kurz úvodu do R. Pokud to není možné, doporučujeme před kurzem samostatnou přípravu s využitím materiálů hojně dostupných na webu.
- pokud máte čas jít do větší hloubky, skvělou knihu R For Data Science zde: https://r4ds.had.co.nz/index.html
- protože používá tidyverse (svět propojených knihoven, resp. balíků v R), doporučujeme pro základní přehled také toto video: https://rstudio.com/resources/webinars/a-gentle-introduction-to-tidy-statistics-in-r/?wvideo=hltkvqscdz
- případně si můžete projít web našeho kurzu Úvod do analýzy dat v R (ASGV00154) (zatím jen v češtině): https://alesvomacka.github.io/Uvod_do_analyzy_dat_v_R/index.html
Poslední úprava: Mgr. Jaromír Mazák, Ph.D. (06.02.2021)
No prerequisites are formally set because we want to keep the course inclusive for people from various fields and faculties, as well as for students from abroad. However, the course assumes a basic knowledge of statistics (about the level of two semesters, as taught at FF UK's Department of Sociology - and probably everywhere else in a similar fashion). Knowledge of the R environment is also an advantage. Ideally, we suggest to first take our Introduction to Data Analysis in R course (ASGV00154) or another semester-long course of introduction to R. If this is not possible, we recommend individual preparation before the course, using materials widely available on the web.
We recommend:
- for complete beginners in R, short introductory videos here: https://rstudio.cloud/learn/primers/1.2 - if you have time to go deeper, a great R For Data Science book here: https://r4ds.had.co.nz/index.html - because we use tidyverse (the world of connected libraries or packages in R), we also recommend the following video for a basic overview of the tidyverse environment: https://rstudio.com/resources/webinars/a-gentle-introduction-to-tidy-statistics-in-r/?wvideo=hltkvqscdz - Alternatively, you can browse the website of our course Introduction to data analysis in R (ASGV00154) (only in CZECH so far): https://alesvomacka.github.io/Uvod_do_analyzy_dat_v_R/index.html