Předměty

Váš prohlížeč nepodporuje JavaScript nebo je jeho podpora vypnutá. Některé funkce nemusejí být dostupné.

Moderní metody v analýze dat (Big data, síťová analýza, analýza textů) - JSB573

Anglický název:	Moderm Methods in Data Analysis
Český název:	Moderní metody v analýze dat (Big data, síťová analýza, analýza textů)
Zajišťuje:	Katedra sociologie (23-KS)
Fakulta:	Fakulta sociálních věd
Platnost:	od 2020
Semestr:	zimní
E-Kredity:	6
Způsob provedení zkoušky:	zimní s.:
Rozsah, examinace:	zimní s.:2/0, Zk [HT]
Počet míst:	neurčen / neurčen (25)
Minimální obsazenost:	neomezen
4EU+:	ne
Virtuální mobilita / počet míst pro virtuální mobilitu:	ne
Stav předmětu:	nevyučován
Jazyk výuky:	čeština
Způsob výuky:	prezenční
Způsob výuky:	prezenční
Poznámka:	předmět je možno zapsat mimo plán povolen pro zápis po webu

Garant:	PhDr. Ing. Petr Soukup, Ph.D. doc. Mgr. Martin Hájek, Ph.D.
Prerekvizity :	JSB535

Termíny zkoušek Rozvrh Nástěnka

Literatura

Poslední úprava: doc. Mgr. Martin Hájek, Ph.D. (18.09.2019)

Kotu, V., B. Deshpande. (2014). Predictive Analytics and Data Mining: Concepts and Practice with RapidMiner.Morgan Kaufmann

Foster, I. Ghani, R. a kol. (2016). Big Data and Social Science: A Practical Guide to Methods and Tools. Chapman & Hall/CRC.

Danneman, N., & Heimann, R. (2014). Social media mining with R. Packt Publishing Ltd. Google books

Salganik, M. (2019). Bit by bit: Social research in the digital age. Princeton University Press.

Scott, J. (2013). Social network analysis (3rd ed). Los Angeles: SAGE Publications.

Krejčí, J., Leontiyeva, Y., Čížek, T., Hamplová, D., Holý, D., Chylíková, J., et al. (2012). Cesty k datům: zdroje a management sociálněvědních dat v České republice. Praha: Sociologické nakladatelství (SLON).

Analýza textů:

Baker, P. (2006) Using Corpora in Discourse Analysis. London: Continuum.

Hájek, M. (2014). Čtenář a stroj: vybrané metody sociálněvědní analýzy textů. Praha: Sociologické nakladatelství (SLON).

Požadavky ke zkoušce

Poslední úprava: PhDr. Ing. Petr Soukup, Ph.D. (30.10.2019)

Výuka probíhá vždy cca 1x za tři týdny v bloku o délce 180 minut. Studenti prokáží schopnost práce s jednotlivými technikami skrze text ve formě draftu článku (na základě vlastní volby z přednášených témat). Text má podobu první verze empirického článku (tj. standardní struktura: přehled literatury, formulace výzkumného problému, použitá data, výsledky analýz, závěry). V článku musí být použit minimálně jeden z přístupů použitých ve 2.-5. bloku výuky.

Hodnocení kurzu:

91 % a více => A
81-90 % => B
71-80 % => C
61-70 % => D
51-60 % => E
0-50 % => F

Sylabus

Poslední úprava: Jana Vojanová (25.10.2019)

Moderní metody v analýze dat (Big data, síťová analýza, analýza textů)

1. Deskriptivní, explorační a konfirmační přístup v analýze dat (aneb jsou vždy nutné hypotézy?) Sekundární analýza dat z mezinárodních šetření. Přehled základních zdrojů. Ukázka offline a online analýz. Základní výzkumné designy: experimenty a výběry, postupy zobecňování. Základní postupy. Matching jako možnost kauzálních úsudků pro neexperimentální data a spojování dat z různých zdrojů (kombinace online sběru a reprezentativních šetření). Méně tradiční postupy v sociálněvědním výzkumu-přehled. Různé podoby dat, základní formáty, konverze formátů. Standardy pro analýzu dat. (Soukup, 17.10.))

2. Big data – fenomén dnešní doby. Základní analytické postupy. Online vs. offline analýza (výběry z big data). Omezení big data. (Hendl, 31.10.))

3. Data mining aneb jak získat data bez dotazování. Základní logika webových stránek z pohledu programovacího kódu. Postupy získávání dat z webových stránek, základní nástroje a jejich využívání. (Sedláček, 14.11.)

4. Úvod do síťové analýzy. Základní nástroje pro sběr dat. Podoby datové matice. Analytické postupy (indexy, mapy). (Soukup, 28.11.)

5. Úvod do kvantitativní analýzy textů: Texty jako data. Možnosti frekvenční analýzy. KWIC a kolokace. Spoluvýskyty slov v korpusu. Od textu k diskurzu. (Hájek, 19.12.)

Hodnocení kurzu:

91 % a více => A
81-90 % => B
71-80 % => C
61-70 % => D
51-60 % => E
0-50 % => F

Prerekvizita: min 1 statistický či datově analytický kurz v předchozím studiu (od popisné statistiky po korelace)