PředmětyPředměty(verze: 962)
Předmět, akademický rok 2023/2024
   Přihlásit přes CAS
Spatial Data Science v sociální geografii - MZ340V17
Anglický název: Spatial Data Science for Social Geography
Český název: Spatial Data Science v sociální geografii
Zajišťuje: Katedra sociální geografie a regionálního rozvoje (31-340)
Fakulta: Přírodovědecká fakulta
Platnost: od 2023 do 2023
Semestr: zimní
E-Kredity: 4
Způsob provedení zkoušky: zimní s.:
Rozsah, examinace: zimní s.:1/2, Zk [HT]
Počet míst: 30
Minimální obsazenost: 5
4EU+: ne
Virtuální mobilita / počet míst pro virtuální mobilitu: ne
Stav předmětu: vyučován
Jazyk výuky: čeština
Další informace: https://martinfleischmann.net/sds/
Poznámka: povolen pro zápis po webu
Garant: Martin Fleischmann, M.Sc., Ph.D.
Vyučující: Martin Fleischmann, M.Sc., Ph.D.
Anotace
Spatial Data Science v sociální geografii zavádí do výuky studentů geografie data science (datovou vědu) a výpočetní analýzu s využitím open source nástrojů napsaných v programovacím jazyce Python.

Předmět poskytuje studentům s malou nebo žádnou předchozí zkušeností s programováním základní kompetence v oblasti spatial data science (SDS). Zahrnuje:

- Rozšíření jejich statistické a numerické gramotnosti.
- Seznámení se základními principy programování a nejmodernějšími výpočetními nástroji pro SDS.
- Představení uceleného přehledu hlavních metodik, které má geograf v oblasti prostorových dat k dispozici, a vybudování intuice, jak a kdy je lze použít.
- Zaměření na reálné aplikace těchto technik v kontextu sociální geografie.

Kurz se zaměřuje na data, která se obvykle používají v sociální geografii, ale jeho použitelnost se neomezuje pouze na sociální geografii. V praxi pracuje spíše s vektorovými daty než s rastry (i když i těmi se trochu zabývá) a často s daty zachycujícími různé aspekty lidského života. Koncepty spatial data science jsou však univerzální.

Po absolvování kurzu budou studenti schopni:

- Prokázat porozumění pokročilým konceptům spatial data science a používat otevřené nástroje pro analýzu prostorových dat.
- Porozumět motivaci a vnitřní logice hlavních metodických přístupů SDS.
- Kriticky zhodnotit vhodnost konkrétních technik, co mohou nabídnout a jak mohou pomoci odpovědět na geografické otázky.
- Použít několik technik prostorové analýzy a interpretovat výsledky v procesu přeměny dat na informace.
- Samostatně pracovat s nástroji SDS s cílem získat cenné poznatky, když se setkají s novým souborem dat.
Poslední úprava: Fleischmann Martin, M.Sc., Ph.D. (28.06.2024)
Literatura

Kurz volně navazuje na obsah knihy Geographic Data Science with Python autorů Rey, Arribas-Bel a Wolf (2023). Online verze knihy je k dispozici v rámci otevřeného přístupu na adrese geographicdata.science/book.

- Rey, Sergio, Dani Arribas-Bel, and Levi John Wolf. 2023. Geographic Data Science with Python. Chapman & Hall/CRC Texts in Statistical Science. London, England: Taylor & Francis.

Poslední úprava: Fleischmann Martin, M.Sc., Ph.D. (02.08.2023)
Požadavky ke zkoušce

Předmět je zakončen seminární prací ve formě výpočetní eseje. Výpočetní esej je esej, jejíž narativ je podpořen kódem a jeho výsledky, které jsou součástí eseje. Esej rozsahem odpovídá 2 500-5 000 slovům. Jedná se však o celkový rozsah. Vzhledem k tomu, že studenti budou muset zpracovat nejen text (v češtině či angličtině), ale také kód a jeho výstupy, jsou zde uvedeny požadavky:

  • Maximální počet slov je 1 500 (bibliografie, pokud je uvedena, se na počtu slov nepodílí).
  • Maximálně 5 map nebo dalších grafických výstupů (jeden výstup může obsahovat více než jednu mapu a bude se počítat pouze jako jeden, ale musí být začleněn do stejného matplotlib objektu)
  • Maximálně 2 tabulky
  • Úkol se opírá o dvě datové sady a má dvě části. Každá z těchto částí bude podrobněji vysvětlena v průběhu kurzu. Případně je možno definovat individuální zadání pokud chce student pracovat s vlastními daty.

Hodnotící kritéria:

Esej je primárně hodnocena na percentuální škále 0-100. Pro úspěšné zakončení předmětu je potřeba získat minimálně 40%:

  • 0-15: kód nefunguje a není k němu žádná dokumentace.
  • 16-39: kód nefunguje nebo funguje, ale nevede k očekávanému výsledku. Existuje dokumentace vysvětlující jeho logiku.
  • 40-49: kód běží a produkuje očekávaný výstup. Existuje určitá dokumentace vysvětlující jeho logiku.
  • 50-59: kód běží a vytváří očekávaný výstup. Existuje rozsáhlá dokumentace vysvětlující jeho logiku.
  • 60-69: kód běží a produkuje očekávaný výstup. Existuje rozsáhlá dokumentace ve správném formátu, která vysvětluje jeho logiku.
  • 70-79: vše jako výše, navíc návrh kódu obsahuje jasné důkazy dovedností prezentovaných v pokročilých částech kurzu (např. vlastní metody, porozumění seznamu atd.).
  • 80-100: vše jako výše, navíc kód obsahuje nové poznatky, které rozšiřují/zlepšují funkčnost, která byla studentovi poskytnuta (např. optimalizace algoritmů, nové metody pro provedení úlohy atd.).
Poslední úprava: Fleischmann Martin, M.Sc., Ph.D. (28.06.2024)
Sylabus

Materiál je naplánován na 11 týdnů s jednou lekcí týdně. Zbylé dva týdny jsou určeny pro konzultace závěrečných prací. Každá lekce je rozdělena do tří částí - Concepts, Hands-on a Exercise. Concepts mají podobu přednášky pokrývající koncepční aspekty tématu daného dne, která poskytuje nezbytné teoretické zázemí předtím, než se začneme věnovat kódu. Tuto část lze přezdívat "I do". Hands-on obsahuje zdokumentovaný kód v Jupyter notebooku, který paralelně provádí lektor, poskytující dodatečný výklad, a studenti. Této části říkáme "We do". Exercise je soubor úkolů, které mají studenti plnit samostatně, s občasným vedením lektora. Den tedy zakončíme částí "You do".

Přehled témat pro jednotivé lekce. V závorce je uvedena klíčový Python balíček pro danou lekci:

  1. Úvod do problematiky
  2. Otevřená data science, základy manipulace s daty v Pythonu (pandas)
  3. Prostorová data (geopandas)
  4. Vztahy v prostoru (libpysal)
  5. Explorativní analýza prostorových dat (esda)
  6. Point patterns (pointpats)
  7. Clustering (scikit-learn)
  8. Rastrová data (xarray)
  9. Interpolace (tobler, pyinterpolate)
  10. Regrese (statsmodels, mgwr)
  11. Machine learning (scikit-learn)
Poslední úprava: Fleischmann Martin, M.Sc., Ph.D. (28.06.2024)
Vstupní požadavky

Tento kurz předpokládá znalost geografie a jejích klíčových pojmů (např. souřadnicových referenčních systémů nebo Modifiable Areal Unit Problem (Openshaw 1983)), alespoň základní znalost GIS (např. formátů souborů a základní manipulace s prostorovými daty) a základní znalost statistiky (např. pochopení konceptu regrese), optimálně s nějakou prostorovou složkou (geograficky vážená regrese). Kurz sice stručně vysvětlí tato témata, ale nebude se podrobně zabývat teorií a statistikou, která za těmito koncepty stojí.

Nejsou potřeba žádné předchozí zkušenosti s programováním nebo informatikou, i když kladný vztah k těmto tématům je nezbytný.

Nutná je možnost práce na vlastním laptopu (předmět nebude vyočován v počítačové učebně) a schopnost porozumět psanému textu v angličtině. 

Studijní materiály budou poskytnuty v anglickém jazyce. Výuka bude probíhat v češtině.

Poslední úprava: Fleischmann Martin, M.Sc., Ph.D. (28.06.2024)
 
Univerzita Karlova | Informační systém UK