PředmětyPředměty(verze: 983)
Předmět, akademický rok 2025/2026
   
R ve fyzické geografii - MZ330P138
Anglický název: R in Physical Geography
Český název: R ve fyzické geografii
Zajišťuje: Katedra fyzické geografie a geoekologie (31-330)
Fakulta: Přírodovědecká fakulta
Platnost: od 2025
Semestr: zimní
E-Kredity: 3
Způsob provedení zkoušky: zimní s.:kombinovaná
Rozsah, examinace: zimní s.:1/1, Z+Zk [HT]
Počet míst: neomezen
Minimální obsazenost: neomezen
4EU+: ne
Virtuální mobilita / počet míst pro virtuální mobilitu: ne
Stav předmětu: vyučován
Jazyk výuky: čeština
Poznámka: povolen pro zápis po webu
při zápisu přednost, je-li ve stud. plánu
Garant: Mgr. Ondřej Ledvinka, Ph.D.
Vyučující: Mgr. Ondřej Ledvinka, Ph.D.
Anotace -
Studenti se detailně seznámí s přístupem tidyverse v programovacím jazyce R. Krátce proběhne jeho porovnání s tzv. base-R funkcemi a také nutné srovnání "starého" pipe operátoru s nativním pipe operátorem. Snahou bude zamezit typickým zlozvykům, jako je nekomentování kódu, nestrukturování kódu nebo nezakládání R projektů. K ovládání jazyka R bude preferováno integrované vývojářské prostředí (IDE) RStudio. Následující část semestru bude věnována aplikacím přístupu tidyverse, proběhne seznámení s prací s vektorovými a rastrovými geodaty a interakcemi mezi nimi. S využitím těchto znalostí a informací získaných z prostorových dat budou studentům představeny základy stavění statistických modelů důležitých při aplikacích strojového učení (tzv. tidymodels přístupy). Aby si studenti lépe uvědomili výstupy jednotlivých funkcí, bude v průběhu celého semestru probíhat kreslení doprovodných grafů a map či mapových schémat.
Poslední úprava: Ledvinka Ondřej, Mgr., Ph.D. (18.08.2025)
Literatura -

Studenti budou předem vybaveni učebními texty lektora v českém jazyce tvořenými v systému Quarto, kde bude kladen důraz na praktické ukázky s uvedením kódu a vybranými výsledky (např. v podobě náhledů na tabulky, grafy či mapy). Vědomosti a dovednosti je pak možné rozšiřovat učením se z textů knih, článků a webových stránek uvedených dole.

Základní literatura (řazeno dle důležitosti):

Rozšiřující literatura (řazeno dle abecedy):

  • Astagneau, P. C., Thirel, G., Delaigue, O., Guillaume, J. H. A., Parajka, J., Brauer, C. C., Viglione, A., Buytaert, W., and Beven, K. J.: Technical note: Hydrology modelling R packages – a unified analysis of models and practicalities from a user perspective, Hydrol. Earth Syst. Sci., 25, 3937–3973, https://doi.org/10.5194/hess-25-3937-2021, 2021.
  • Bivand, R., Pebesma, E. J., and Gómez-Rubio, V.: Applied Spatial Data Analysis with R, 2nd ed., Springer, New York, 405 pp., 2013.
  • Grolemund, G. and Wickham, H.: Dates and times made easy with lubridate, Journal of Statistical Software, 40, 1–25, https://doi.org/10.18637/jss.v040.i03, 2011.
  • Ismay, C. and Kim, A. Y.-S.: Statistical Inference via Data Science: A Modern Dive into R and the Tidyverse, CRC Press / Taylor & Francis Group, Boca Raton, 2020. (online verze na https://moderndive.com/v2/)
  • James, G., Witten, D., Hastie, T., and Tibshirani, R.: An Introduction to Statistical Learning: With Applications in R, Springer New York, New York, NY, 2013.
  • Kuhn, M. and Johnson, K.: Applied Predictive Modeling, Springer New York, New York, NY, 2013.
  • Kuhn, M. and Johnson, K.: Feature Engineering and Selection: A Practical Approach for Predictive Models, CRC Press, Boca Raton, 297 pp., 2020. (online verze na http://www.feat.engineering/)
  • Kuhn, M. and Silge, J.: Tidy Modeling with R: A Framework for Modeling in the Tidyverse, O’Reilly, Boston, 363 pp., 2022. (online verze na https://www.tmwr.org/; viz také stránky https://www.tidymodels.org/)
  • Lacko, J.: RCzechia: Spatial objects of the Czech Republic, JOSS, 8, 5082, https://doi.org/10.21105/joss.05082, 2023.
  • Ledvinka, O.: R balíčky určené k práci s geodaty a jejich využití v projektu PERUN, in: Zborník príspevkov medzinárodnej konferencie OSSConf 2025, edited by: Blaško, R. and Stříž, P., Žilinská univerzita v Žiline, Žilina, 95–102, 2025. (elektronická verze sborníku na: https://frcatel.fri.uniza.sk/ossconf/zborniky-online/z2025.html)
  • Lovelace, R., Nowosad, J., and Muenchow, J.: Geocomputation with R, 2nd ed., CRC Press, Boca Raton, FL, 2025. (online verze na https://r.geocompx.org/)
  • Moraga, P.: Spatial Statistics for Data Science: Theory and Practice with R, Chapman and Hall/CRC, Boca Raton, 2024. (online verze na https://www.paulamoraga.com/book-spatial/)
  • Pebesma, E.: Simple features for R: standardized support for spatial vector data, The R Journal, 10, 439–446, https://doi.org/10.32614/RJ-2018-009, 2018.
  • Pebesma, E., Mailund, T., and Hiebert, J.: Measurement units in R, The R Journal, 8, 486-494, https://doi.org/10.32614/RJ-2016-061, 2016.
  • Slater, L. J., Thirel, G., Harrigan, S., Delaigue, O., Hurley, A., Khouakhi, A., Prosdocimi, I., Vitolo, C., and Smith, K.: Using R in hydrology: a review of recent developments and future directions, Hydrol. Earth Syst. Sci., 23, 2939–2963, doi: 10.5194/hess-23-2939-2019, 2019.
  • Tennekes, M.: tmap: thematic maps in R, J. Stat. Soft., 84, 1–39, https://doi.org/10.18637/jss.v084.i06, 2018.
  • Wickham, H.: ggplot2: Elegant Graphics for Data Analysis, 2nd ed., Springer, Cham, 260 pp., 2016.
  • Wickham, H., Averick, M., Bryan, J., Chang, W., McGowan, L., François, R., Grolemund, G., Hayes, A., Henry, L., Hester, J., Kuhn, M., Pedersen, T., Miller, E., Bache, S., Müller, K., Ooms, J., Robinson, D., Seidel, D., Spinu, V., Takahashi, K., Vaughan, D., Wilke, C., Woo, K., and Yutani, H.: Welcome to the tidyverse, JOSS, 4, 1686, https://doi.org/10.21105/joss.01686, 2019.
  • Wimberly, M. C.: Geographic Data Science with R: Visualizing and Analyzing Environmental Change, Chapman and Hall/CRC, Boca Raton, 2023. (online verze na https://bookdown.org/mcwimberly/gdswr-book/)

Další online zdroje:

Poslední úprava: Ledvinka Ondřej, Mgr., Ph.D. (01.09.2025)
Požadavky ke zkoušce -

Každý student bude v průběhu semestru pracovat na projektu, který založíme společně hned na začátku semestru. Dokončení projektu poskytující správné výsledky bude podmínkou pro udělení zápočtu a rovněž tak podmínkou pro složení ústní zkoušky.

Poslední úprava: Ledvinka Ondřej, Mgr., Ph.D. (19.08.2025)
Sylabus -
  1. Základy práce s R a RStudio a dobré zvyky při psaní kódu; nativní pipe operátor jako základ přístupu tidyverse a kreslení grafů ve smyslu ggplot2 na podkladě datasetů přicházejících s R a jeho přídavnými balíčky; instalace a načítání přídavných balíčků (CRAN, GitHub aj. zdroje); základy práce s nápovědami
  2. Základy načítání externích tabulkových dat, jejich pivoting a různé typy souborů, které R produkuje (.RData, .RDS, .R, .Rhistory) a možnosti ukládání výsledných dat do běžnějších formátů, které lze načítat i v jiných jazycích či softwarech; upozornění na práci s dočasnými soubory
  3. Logické vektory, čísla
  4. Textové řetězce, regulární výrazy, faktory
  5. Datum a čas, časové zóny; chybějící hodnoty (NA) a jiné speciální konstanty (NaN, -Inf, Inf, pi, exp(1) alias základ přirozeného logaritmu, -digamma(1) alias Eulerova konstanta apod.); propojování tabulek na základě klíčů
  6. Práce s dalšími zdroji dat - databázové soubory, hierarchická data, internet
  7. Vlastní (pojmenované) funkce, anonymní funkce a základy funkcionálního programování
  8. Vektorová geodata coby tabulky s geometrickým sloupcem a prostorové dotazy na nich založené; prostorový join; cropping a clipping
  9. Rastrová geodata a různé strategie jejich tvorby a zpracování; cropping a maskování; interakce rastrových a vektorových geodat
  10. Družicové snímky jako příklad rastrových geodat, RGB a jiné kompozity; klasifikace; rastry klimatických modelů; odkaz na Google Earth Engine
  11. Tvorba map v R a detailnější zaměření na tvorbu grafů v R
  12. Statistické modely ve fyzické geografii, jejich stavba a hodnocení jejich výkonnosti
  13. Základy práce s časovými řadami; hydrologické modely v R
Poslední úprava: Ledvinka Ondřej, Mgr., Ph.D. (18.08.2025)
 
Univerzita Karlova | Informační systém UK