The course aims at describing basic concepts of descriptive, inferential and exploratory statistics. The theoretical part is accompanied by practical part in which we learn how these concepts are implemented in R software. The emphasis is on use-cases related to linguistics and digital humanities.
Last update: Cvrček Václav, prof. Mgr., Ph.D. (23.01.2023)
Díky bezprecedentnímu nárůstu dostupných digitálních textových dat se už ani v čistě humanitních oborech, jako
jsou nejrůznější filologie, neobejdeme bez kvantitativních výzkumných technik. Třebaže je učební plány vašich
oborů ještě většinou neobsahují, věřte, že se bez nich těžko zapojíte do mezinárodní výzkumné komunity. Pojďte
se proto s námi na jeden semestr ponořit do moderně vedených výzkumných úloh na literárních i lingvistických
datech a osvojte si přitom základy statistiky a programovacího jazyka R, který je nyní patrně nejoblíbenějším
nástrojem pro zpracování kvantitativních dat ve společenských vědách. Cílíme hlavně na ty z vás, kteří nikdy
nezkusili programovat, nemají rozsáhlé znalosti statistiky a chtějí se přitom něco nového naučit.
Pozor, předmět lze zapsat na MFF i FF (záleží na Vaší fakultě a preferenci).
Pokud chcete dostávat další zprávy o náplni, době a místě konání kurzu, napište si o ně na
cinkova@ufal.mff.cuni.cz.
Sledovat nás můžete i na Twitteru @RLingStat #RLingStat.<br>
Těšíme se s vámi na užitečný a inspirativní semestr!
Mgr. Silvie Cinková, Ph.D., UFAL MFF UK
prof. Václav Cvrček, Ph.D., ÚČNK FF UK
Last update: Cvrček Václav, prof. Mgr., Ph.D. (23.01.2023)
Course completion requirements -
active attendence on seminars
Last update: Kováříková Dominika, Mgr., M.A., Ph.D. (24.06.2024)
Podmínky zakončení předmětu: aktivní účast na seminářích.
Last update: Kováříková Dominika, Mgr., M.A., Ph.D. (24.06.2024)
Literature -
Baayen, H. R.: Analyzing Linguistic Data, Cambridge University Press, Cambridge 2008. Baayen, H. R.: Word Frequency Distributions. Kluwer Academic Publishers. Dordrecht/Boston/London 2010. Bartoň, T. - Cvrček, V. - Čermák, F. - Jelínek, T. - Petkevič, V. (2009): Statistiky češtiny. Nakladatelství Lidové noviny, Praha 2009. Gries, S. Th.: Quantitative Corpus Linguistics with R, Routledge 2009. Oakes, M. P.: Statistics for Corpus Linguistics. Edinburgh University Press, Edinburgh 1998. Volín, J. (2007): Statistické metody ve fonetickém výzkumu. Praha: Epocha.
Last update: Kováříková Dominika, Mgr., M.A., Ph.D. (08.12.2019)
Literatura: Baayen, H. R.: Analyzing Linguistic Data, Cambridge University Press, Cambridge 2008. Baayen, H. R.: Word Frequency Distributions. Kluwer Academic Publishers. Dordrecht/Boston/London 2010. Bartoň, T. - Cvrček, V. - Čermák, F. - Jelínek, T. - Petkevič, V. (2009): Statistiky češtiny. Nakladatelství Lidové noviny, Praha 2009. Gries, S. Th.: Quantitative Corpus Linguistics with R, Routledge 2009. Oakes, M. P.: Statistics for Corpus Linguistics. Edinburgh University Press, Edinburgh 1998. Volín, J. (2007): Statistické metody ve fonetickém výzkumu. Praha: Epocha.
Last update: Kováříková Dominika, Mgr., M.A., Ph.D. (08.12.2019)
Requirements to the exam -
The deadline for completing study requirements assigned on the DataCamp platform is limited by the validity of the license (exactly 6 months from the first scheduled class of the semester). Alternative completion outside of DataCamp is not possible.
Last update: Kováříková Dominika, Mgr., M.A., Ph.D. (24.06.2024)
Termín splnění studijních povinností zadaných na platformě DataCamp je omezen platností licence (přesně 6 měsíců od první rozvržené hodiny v semestru). Náhradní plnění mimo DataCamp není možné.
Last update: Kováříková Dominika, Mgr., M.A., Ph.D. (24.06.2024)