SubjectsSubjects(version: 861)
Course, academic year 2019/2020
  
Moderm Methods in Data Analysis - JSB573
Title: Moderní metody v analýze dat (Big data, síťová analýza, analýza textů)
Czech title: Moderní metody v analýze dat (Big data, síťová analýza, analýza textů)
Guaranteed by: Department of Sociology (23-KS)
Faculty: Faculty of Social Sciences
Actual: from 2019 to 2019
Semester: winter
Points: 6
E-Credits: 6
Examination process: winter s.:
Hours per week, examination: winter s.:2/0 Ex [hours/week]
Capacity: unlimited / unknown (25)
Min. number of students: unlimited
State of the course: taught
Language: Czech
Teaching methods: full-time
Note: course can be enrolled in outside the study plan
enabled for web enrollment
Guarantor: PhDr. Ing. Petr Soukup, Ph.D.
doc. Mgr. Martin Hájek, Ph.D.
prof. RNDr. Jan Hendl, CSc.
Teacher(s): doc. Mgr. Martin Hájek, Ph.D.
prof. RNDr. Jan Hendl, CSc.
PhDr. Ing. Petr Soukup, Ph.D.
Pre-requisite : JSB535
Literature - Czech
Last update: doc. Mgr. Martin Hájek, Ph.D. (18.09.2019)

Kotu, V., B. Deshpande. (2014). Predictive Analytics and Data Mining: Concepts and Practice with RapidMiner.Morgan Kaufmann

Foster, I. Ghani, R. a kol. (2016). Big Data and Social Science: A Practical Guide to Methods and Tools. Chapman & Hall/CRC.  

Danneman, N., & Heimann, R. (2014). Social media mining with R. Packt Publishing Ltd. Google books

Salganik, M. (2019). Bit by bit: Social research in the digital age. Princeton University Press.

Scott, J. (2013). Social network analysis (3rd ed). Los Angeles: SAGE Publications.

Krejčí, J., Leontiyeva, Y., Čížek, T., Hamplová, D., Holý, D., Chylíková, J., et al. (2012). Cesty k datům: zdroje a management sociálněvědních dat v České republice. Praha: Sociologické nakladatelství (SLON).

Analýza textů:

Baker, P. (2006) Using Corpora in Discourse Analysis. London: Continuum.

Hájek, M. (2014). Čtenář a stroj: vybrané metody sociálněvědní analýzy textů. Praha: Sociologické nakladatelství (SLON).

 

Requirements to the exam - Czech
Last update: PhDr. Ing. Petr Soukup, Ph.D. (30.10.2019)

Výuka probíhá vždy cca 1x za tři týdny v bloku o délce 180 minut. Studenti prokáží schopnost práce s jednotlivými technikami skrze text ve formě draftu článku (na základě vlastní volby z přednášených témat). Text má podobu první verze empirického článku (tj. standardní struktura: přehled literatury, formulace výzkumného problému, použitá data, výsledky analýz, závěry). V článku musí být použit minimálně jeden z přístupů použitých ve 2.-5. bloku výuky.

Hodnocení kurzu:

91 % a více       =>         A
81-90 %            =>         B
71-80 %            =>         C
61-70 %            =>         D
51-60 %            =>         E
0-50 %              =>         F

Syllabus - Czech
Last update: Jana Vojanová (25.10.2019)

Moderní metody v analýze dat (Big data, síťová analýza, analýza textů)

1.       Deskriptivní, explorační a konfirmační přístup v analýze dat (aneb jsou vždy nutné hypotézy?) Sekundární analýza dat z mezinárodních šetření. Přehled základních zdrojů. Ukázka offline a online analýz. Základní výzkumné designy: experimenty a výběry, postupy zobecňování. Základní postupy. Matching jako možnost kauzálních úsudků pro neexperimentální data a spojování dat z různých zdrojů (kombinace online sběru a  reprezentativních šetření). Méně tradiční postupy v sociálněvědním výzkumu-přehled. Různé podoby dat, základní formáty, konverze formátů. Standardy pro analýzu dat. (Soukup, 17.10.))

2.       Big data – fenomén dnešní doby. Základní analytické postupy. Online vs. offline analýza (výběry z big data). Omezení big data. (Hendl, 31.10.))

3.       Data mining aneb jak získat data bez dotazování. Základní logika webových stránek z pohledu programovacího kódu. Postupy získávání dat z webových stránek, základní nástroje a jejich využívání. (Sedláček, 14.11.)

4.       Úvod do síťové analýzy. Základní nástroje pro sběr dat. Podoby datové matice. Analytické postupy (indexy, mapy). (Soukup, 28.11.)

5.       Úvod do kvantitativní analýzy textů: Texty jako data. Možnosti frekvenční analýzy. KWIC a kolokace. Spoluvýskyty slov v korpusu. Od textu k diskurzu.  (Hájek, 19.12.)

Výuka probíhá vždy cca 1x za tři týdny v bloku o délce 180 minut. Studenti prokáží schopnost práce s jednotlivými technikami skrze text ve formě draftu článku (na základě vlastní volby z přednášených témat). Text má podobu první verze empirického článku (tj. standardní struktura: přehled literatury, formulace výzkumného problému, použitá data, výsledky analýz, závěry). V článku musí být použit minimálně jeden z přístupů použitých ve 2.-5. bloku výuky.

Hodnocení kurzu:

91 % a více       =>         A
81-90 %            =>         B
71-80 %            =>         C
61-70 %            =>         D
51-60 %            =>         E
0-50 %              =>         F

 

Prerekvizita: min 1 statistický či datově analytický kurz v předchozím studiu (od popisné statistiky po korelace)

 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html