SubjectsSubjects(version: 945)
Course, academic year 2023/2024
   Login via CAS
Troubleshooting R - JSB753
Title: Řešení problémů ve statistickém prostředí R
Czech title: Řešení problémů ve statistickém prostředí R
Guaranteed by: Department of Sociology (23-KS)
Faculty: Faculty of Social Sciences
Actual: from 2023
Semester: winter
E-Credits: 3
Examination process: winter s.:
Hours per week, examination: winter s.:1/1, C [HT]
Capacity: unlimited / unlimited (unknown)
Min. number of students: unlimited
4EU+: no
Virtual mobility / capacity: no
State of the course: taught
Language: Czech
Teaching methods: full-time
Teaching methods: full-time
Note: course can be enrolled in outside the study plan
enabled for web enrollment
Guarantor: Mgr. Jan Urban, Ph.D.
Teacher(s): Mgr. Jan Urban, Ph.D.
Annotation - Czech
Last update: Mgr. Jan Urban, Ph.D. (18.09.2023)
Tento prakticky zaměřený kurz je určen nejen pro studenty a studentky, kteří využívají statistické prostředí R, ale i pro studenty, kteří již využívají jiné analytické softwary a chtěli by nahlédnout do konkrétní práce v prostředí R. Cílem kurzu je reagovat na problémy v úvodních krocích přípravy dat, které studenti nemusí dokázat odstranit a které jim brání v dalším používání prostředí R. V rámci tohoto kurzu se naučíme generické postupy (např. debugging, čtení vignettes, vyhledávání návodů a tutoriálů apod.), které umožňují problémy samostatně řešit. Kurz se zaměřuje zejména na problémy, které nastávají v následujících krocích při analýze dat: (i) natahování dat v různých formátech do R; (ii) efektivní instalace a načítání balíčků v R; (iii) kontrola a čištění dat; (iv) transformace dat (dlouhé a krátké formáty, Tidy data); (v) ukládání dat, archivace a sdílení dat. V rámci kurzu budeme především rozebírat konkrétní problémy, na které narazili sami posluchači a poskuchačky kurzu, a budeme si ukazovat, jak je možné tyto problémy efektivně řešit. Kurz zvýší schopnost posluchačů a posluchaček samostatně využívat R a řešit nové problémy, na které při práci v R narazí. Druhotným přínosem tohoto kurzu bude, že se posluchači a posluchačky seznamí s dalšími uživateli R a naučí se problémy v R řešit kolektivně, v komunitním duchu projektu R.
Aim of the course - Czech
Last update: Mgr. Jan Urban, Ph.D. (18.09.2023)

(a) zvýšit obecnu schopnost řešit samostatně problémy, které nastanou při práci v R;

(b) naučit se řešit konkrétní vybrané problémy v prostředí R při přípravě dat, s nimiž se účastníci a účastnice v současnosti potýkají;

(c) seznámit se s efektivními postupy transformace dat (s balíčky dplyr a tidyr);

(d) seznámit se s efektivními způsoby archivace a sdílení dat a skriptů v R s ohledem na principy otevřené vědy.

Literature - Czech
Last update: Mgr. Jan Urban, Ph.D. (18.09.2023)

Wickham, H., Çetinkaya-Rundel, M., & Grolemund, G. (2023). R for data science: Import, tidy, transform, visualize, and model data (2nd edition). O’Reilly Media, Inc. (jako open dokument dostupné zde: https://r4ds.hadley.nz/data-visualize)

(Další literature bude upřesněna v průběhu kurzu.)

 

Syllabus - Czech
Last update: Mgr. Jan Urban, Ph.D. (04.10.2023)

Název kurzu: Řešení problémů ve statistickém prostředí R

Rozšířený sylabus: https://docs.google.com/document/d/1an9RkoLvNtPLPuhqSeIwBgXPBEI9shk270QPg1-sS58/edit?usp=sharing

 

Přednášející: Mgr. Jan Urban, Ph.D.

 

Forma kurzu: přednáška a cvičení (1/1)

 

Forma atestace: zápočet (3 kredity)

 

Abstrakt

Tento prakticky zaměřený kurz je určen nejen pro studenty a studentky, kteří využívají statistické prostředí R, ale i pro studenty, kteří již využívají jiné analytické softwary a chtěli by nahlédnout do konkrétní práce v prostředí R. Cílem kurzu je reagovat na problémy v úvodních krocích přípravy dat, které studenti nemusí dokázat  odstranit a které jim brání v dalším používání prostředí R. V rámci tohoto kurzu se naučíme generické postupy (např. debugging, čtení vignettes, vyhledávání návodů a tutoriálů apod.), které umožňují problémy samostatně řešit. Kurz se zaměřuje zejména na problémy, které nastávají v následujících krocích při analýze dat: (i) natahování dat v různých formátech do R; (ii) efektivní instalace a načítání balíčků v R; (iii) kontrola a čištění dat; (iv) transformace dat (dlouhé a krátké formáty, Tidy data); (v) ukládání dat, archivace a sdílení dat. V rámci kurzu budeme především rozebírat konkrétní problémy, na které narazili sami posluchači a poskuchačky kurzu, a budeme si ukazovat, jak je možné tyto problémy efektivně řešit. Kurz zvýší schopnost posluchačů a posluchaček samostatně využívat R a řešit nové problémy, na které při práci v R narazí. Druhotným přínosem tohoto kurzu bude, že se posluchači a posluchačky seznamí s dalšími uživateli R a naučí se problémy v R řešit kolektivně, v komunitním duchu projektu R.

 

Cíle kurzu

(a) zvýšit obecnu schopnost řešit samostatně problémy, které nastanou při práci v R;

(b) naučit se řešit konkrétní vybrané problémy v prostředí R při přípravě dat, s nimiž se účastníci a účastnice v současnosti potýkají;

(c) seznámit se s efektivními postupy transformace dat (s balíčky dplyr a tidyr);

(d) seznámit se s efektivními způsoby archivace a sdílení dat a skriptů v R s ohledem na principy otevřené vědy.

 

Co není cílem kurzu

Tento kurz nenahrazuje systematický úvod do práce v prostředí R a kurzy zaměřené na analýzu dat v prostředí R, přesto si jej však mohou zapsat studenti, kteří mají zkušenosti s jiným analytickým prostředím (SPSS, Jamovi) a chtěli by se naučit využívat prostředí R

 

Formát kurzu

Kurz bude kombinovat krátké přednášky na vybraná témata s praktickými cvičeními, během nichž budeme odstraňovat typické problémy, anebo problémy, na které studenti narazí při vlastní práci v prostředí R.

 

Vstupní znalosti R

Předchozí znalosti práce v prostředí R nejsou nutnou podmínkou účasti v kurzu (ale jsou výhodou). Podmínkou účasti v kurzu je ochota učit se pracovat v prostředí R. 

 

Jazyk

Kurz bude vyučován v českém jazyce, ale v kurzu budeme převážně pracovat s materiály v anglickém jazyce.

 

Harmonogram

  1. Úvod. Co je R a RStudio, systém práce v R, instalace a načítání balíčků.

  2. Kde a jak hledat pomoc. Identifikace problému a generické způsoby hledání řešení.

  3. Natahování dat do R.

  4. Kontrola a vizualizace dat.

  5. Chybové hlášky 1: typy objektů.

  6. Chybové hlášky 2: chybějící data.

  7. Další časté chybové hlášky.

  8. Základní formáty dat. Dlouhá data, široká data, smíšené typy, Tidy formát.

  9. Transformace dat z jednoho formátu do jiného.

  10. Základní kroky při čištění dat. Duplicity, chybějící hodnoty, logická konzistence.

  11. Ukládání, popis a sdílení dat a skriptů.

  12. Shrnutí častých problémů a jejich řešení.

 

Literatura

Wickham, H., Çetinkaya-Rundel, M., & Grolemund, G. (2023). R for data science: Import, tidy, transform, visualize, and model data (2nd edition). O’Reilly Media, Inc. (jako open dokument dostupné zde: https://r4ds.hadley.nz/data-visualize)

 

(Další literature bude upřesněna v průběhu kurzu.)

 

Entry requirements - Czech
Last update: Mgr. Jan Urban, Ph.D. (18.09.2023)

Vstupní znalosti R

Předchozí znalosti práce v prostředí R nejsou nutnou podmínkou účasti v kurzu (ale jsou výhodou). Podmínkou účasti v kurzu je ochota učit se pracovat v prostředí R.

 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html