PředmětyPředměty(verze: 945)
Předmět, akademický rok 2022/2023
   Přihlásit přes CAS
Moderní metody v analýze dat (Big data, síťová analýza, analýza textů) - JSB573
Anglický název: Moderm Methods in Data Analysis
Český název: Moderní metody v analýze dat (Big data, síťová analýza, analýza textů)
Zajišťuje: Katedra sociologie (23-KS)
Fakulta: Fakulta sociálních věd
Platnost: od 2020
Semestr: zimní
E-Kredity: 6
Způsob provedení zkoušky: zimní s.:
Rozsah, examinace: zimní s.:2/0, Zk [HT]
Počet míst: neurčen / neurčen (25)
Minimální obsazenost: neomezen
4EU+: ne
Virtuální mobilita / počet míst pro virtuální mobilitu: ne
Stav předmětu: nevyučován
Jazyk výuky: čeština
Způsob výuky: prezenční
Způsob výuky: prezenční
Poznámka: předmět je možno zapsat mimo plán
povolen pro zápis po webu
Garant: PhDr. Ing. Petr Soukup, Ph.D.
doc. Mgr. Martin Hájek, Ph.D.
Prerekvizity : JSB535
Termíny zkoušek   Rozvrh   Nástěnka   
Literatura
Poslední úprava: doc. Mgr. Martin Hájek, Ph.D. (18.09.2019)

Kotu, V., B. Deshpande. (2014). Predictive Analytics and Data Mining: Concepts and Practice with RapidMiner.Morgan Kaufmann

Foster, I. Ghani, R. a kol. (2016). Big Data and Social Science: A Practical Guide to Methods and Tools. Chapman & Hall/CRC.  

Danneman, N., & Heimann, R. (2014). Social media mining with R. Packt Publishing Ltd. Google books

Salganik, M. (2019). Bit by bit: Social research in the digital age. Princeton University Press.

Scott, J. (2013). Social network analysis (3rd ed). Los Angeles: SAGE Publications.

Krejčí, J., Leontiyeva, Y., Čížek, T., Hamplová, D., Holý, D., Chylíková, J., et al. (2012). Cesty k datům: zdroje a management sociálněvědních dat v České republice. Praha: Sociologické nakladatelství (SLON).

Analýza textů:

Baker, P. (2006) Using Corpora in Discourse Analysis. London: Continuum.

Hájek, M. (2014). Čtenář a stroj: vybrané metody sociálněvědní analýzy textů. Praha: Sociologické nakladatelství (SLON).

 

Požadavky ke zkoušce
Poslední úprava: PhDr. Ing. Petr Soukup, Ph.D. (30.10.2019)

Výuka probíhá vždy cca 1x za tři týdny v bloku o délce 180 minut. Studenti prokáží schopnost práce s jednotlivými technikami skrze text ve formě draftu článku (na základě vlastní volby z přednášených témat). Text má podobu první verze empirického článku (tj. standardní struktura: přehled literatury, formulace výzkumného problému, použitá data, výsledky analýz, závěry). V článku musí být použit minimálně jeden z přístupů použitých ve 2.-5. bloku výuky.

Hodnocení kurzu:

91 % a více       =>         A
81-90 %            =>         B
71-80 %            =>         C
61-70 %            =>         D
51-60 %            =>         E
0-50 %              =>         F

Sylabus
Poslední úprava: Jana Vojanová (25.10.2019)

Moderní metody v analýze dat (Big data, síťová analýza, analýza textů)

1.       Deskriptivní, explorační a konfirmační přístup v analýze dat (aneb jsou vždy nutné hypotézy?) Sekundární analýza dat z mezinárodních šetření. Přehled základních zdrojů. Ukázka offline a online analýz. Základní výzkumné designy: experimenty a výběry, postupy zobecňování. Základní postupy. Matching jako možnost kauzálních úsudků pro neexperimentální data a spojování dat z různých zdrojů (kombinace online sběru a  reprezentativních šetření). Méně tradiční postupy v sociálněvědním výzkumu-přehled. Různé podoby dat, základní formáty, konverze formátů. Standardy pro analýzu dat. (Soukup, 17.10.))

2.       Big data – fenomén dnešní doby. Základní analytické postupy. Online vs. offline analýza (výběry z big data). Omezení big data. (Hendl, 31.10.))

3.       Data mining aneb jak získat data bez dotazování. Základní logika webových stránek z pohledu programovacího kódu. Postupy získávání dat z webových stránek, základní nástroje a jejich využívání. (Sedláček, 14.11.)

4.       Úvod do síťové analýzy. Základní nástroje pro sběr dat. Podoby datové matice. Analytické postupy (indexy, mapy). (Soukup, 28.11.)

5.       Úvod do kvantitativní analýzy textů: Texty jako data. Možnosti frekvenční analýzy. KWIC a kolokace. Spoluvýskyty slov v korpusu. Od textu k diskurzu.  (Hájek, 19.12.)

Výuka probíhá vždy cca 1x za tři týdny v bloku o délce 180 minut. Studenti prokáží schopnost práce s jednotlivými technikami skrze text ve formě draftu článku (na základě vlastní volby z přednášených témat). Text má podobu první verze empirického článku (tj. standardní struktura: přehled literatury, formulace výzkumného problému, použitá data, výsledky analýz, závěry). V článku musí být použit minimálně jeden z přístupů použitých ve 2.-5. bloku výuky.

Hodnocení kurzu:

91 % a více       =>         A
81-90 %            =>         B
71-80 %            =>         C
61-70 %            =>         D
51-60 %            =>         E
0-50 %              =>         F

 

Prerekvizita: min 1 statistický či datově analytický kurz v předchozím studiu (od popisné statistiky po korelace)

 
Univerzita Karlova | Informační systém UK