Díky bezprecedentnímu nárůstu dostupných digitálních textových dat se už ani v čistě humanitních oborech, jako
jsou nejrůznější filologie, neobejdeme bez kvantitativních výzkumných technik. Třebaže je učební plány vašich
oborů ještě většinou neobsahují, věřte, že se bez nich těžko zapojíte do mezinárodní výzkumné komunity. Pojďte
se proto s námi na jeden semestr ponořit do moderně vedených výzkumných úloh na literárních i lingvistických
datech a osvojte si přitom základy statistiky a programovacího jazyka R, který je nyní patrně nejoblíbenějším
nástrojem pro zpracování kvantitativních dat ve společenských vědách. Cílíme hlavně na ty z vás, kteří nikdy
nezkusili programovat, nemají rozsáhlé znalosti statistiky a chtějí se přitom něco nového naučit.
Pozor, předmět lze zapsat na MFF i FF (záleží na Vaší fakultě a preferenci).
Pokud chcete dostávat další zprávy o náplni, době a místě konání kurzu, napište si o ně na
cinkova@ufal.mff.cuni.cz.
Sledovat nás můžete i na Twitteru @RLingStat #RLingStat.<br>
Těšíme se s vámi na užitečný a inspirativní semestr!
Mgr. Silvie Cinková, Ph.D., UFAL MFF UK
prof. Václav Cvrček, Ph.D., ÚČNK FF UK
Poslední úprava: Cvrček Václav, prof. Mgr., Ph.D. (23.01.2023)
The course aims at describing basic concepts of descriptive, inferential and exploratory statistics. The theoretical part is accompanied by practical part in which we learn how these concepts are implemented in R software. The emphasis is on use-cases related to linguistics and digital humanities.
Poslední úprava: Cvrček Václav, prof. Mgr., Ph.D. (23.01.2023)
Podmínky zakončení předmětu -
Podmínky zakončení předmětu: aktivní účast na seminářích.
Poslední úprava: Kováříková Dominika, Mgr., M.A., Ph.D. (24.06.2024)
active attendence on seminars
Poslední úprava: Kováříková Dominika, Mgr., M.A., Ph.D. (24.06.2024)
Literatura -
Literatura: Baayen, H. R.: Analyzing Linguistic Data, Cambridge University Press, Cambridge 2008. Baayen, H. R.: Word Frequency Distributions. Kluwer Academic Publishers. Dordrecht/Boston/London 2010. Bartoň, T. - Cvrček, V. - Čermák, F. - Jelínek, T. - Petkevič, V. (2009): Statistiky češtiny. Nakladatelství Lidové noviny, Praha 2009. Gries, S. Th.: Quantitative Corpus Linguistics with R, Routledge 2009. Oakes, M. P.: Statistics for Corpus Linguistics. Edinburgh University Press, Edinburgh 1998. Volín, J. (2007): Statistické metody ve fonetickém výzkumu. Praha: Epocha.
Poslední úprava: Kováříková Dominika, Mgr., M.A., Ph.D. (08.12.2019)
Baayen, H. R.: Analyzing Linguistic Data, Cambridge University Press, Cambridge 2008. Baayen, H. R.: Word Frequency Distributions. Kluwer Academic Publishers. Dordrecht/Boston/London 2010. Bartoň, T. - Cvrček, V. - Čermák, F. - Jelínek, T. - Petkevič, V. (2009): Statistiky češtiny. Nakladatelství Lidové noviny, Praha 2009. Gries, S. Th.: Quantitative Corpus Linguistics with R, Routledge 2009. Oakes, M. P.: Statistics for Corpus Linguistics. Edinburgh University Press, Edinburgh 1998. Volín, J. (2007): Statistické metody ve fonetickém výzkumu. Praha: Epocha.
Poslední úprava: Kováříková Dominika, Mgr., M.A., Ph.D. (08.12.2019)
Požadavky ke zkoušce -
Termín splnění studijních povinností zadaných na platformě DataCamp je omezen platností licence (přesně 6 měsíců od první rozvržené hodiny v semestru). Náhradní plnění mimo DataCamp není možné.
Poslední úprava: Kováříková Dominika, Mgr., M.A., Ph.D. (24.06.2024)
The deadline for completing study requirements assigned on the DataCamp platform is limited by the validity of the license (exactly 6 months from the first scheduled class of the semester). Alternative completion outside of DataCamp is not possible.
Poslední úprava: Kováříková Dominika, Mgr., M.A., Ph.D. (24.06.2024)