PředmětyPředměty(verze: 945)
Předmět, akademický rok 2023/2024
   Přihlásit přes CAS
Teoretické základy statistického vyhodnocování jazykových dat v R - NPFL137
Anglický název: Theory of Statistical Analysis in R for Linguists
Zajišťuje: Ústav formální a aplikované lingvistiky (32-UFAL)
Fakulta: Matematicko-fyzikální fakulta
Platnost: od 2023
Semestr: letní
E-Kredity: 2
Rozsah, examinace: letní s.:2/0, Zk [HT]
Počet míst: neomezen
Minimální obsazenost: neomezen
4EU+: ne
Virtuální mobilita / počet míst pro virtuální mobilitu: ne
Stav předmětu: vyučován
Jazyk výuky: čeština
Způsob výuky: prezenční
Způsob výuky: prezenční
Garant: Mgr. Silvie Cinková, Ph.D.
Třída: DS, matematická lingvistika
Informatika Mgr. - Matematická lingvistika
Kategorizace předmětu: Informatika > Počítačová a formální lingvistika
Neslučitelnost : NPFL111
Záměnnost : NPFL111
Je neslučitelnost pro: NPFL111
Je záměnnost pro: NPFL111
Anotace -
Poslední úprava: RNDr. Jiří Mírovský, Ph.D. (12.05.2022)
Pokročilejší zájemci o korpusovou lingvistiku, kteří absolvovali libovolný základní seminář práce s korpusy, mohou v rámci tohoto semináře prohloubit svoje znalosti statistického zpracování dat. Kurs je zaměřen jak na statistickou teorii (zejména otázky týkající se korpusové lingvistiky a specifických rozdělení jazykových dat) i na praktické zvládnutí nástrojů na provádění výpočtu (zejm. R). Kurs předpokládá uživatelskou znalost práce s PC.
Podmínky zakončení předmětu -
Poslední úprava: Mgr. Silvie Cinková, Ph.D. (22.05.2023)
  • aktivní účast na hodinách (přípustné jsou 3 nepřítomnosti)

Literatura -
Poslední úprava: Mgr. Silvie Cinková, Ph.D. (22.05.2023)

Baayen, H. R.: Analyzing Linguistic Data, Cambridge University Press, Cambridge 2008.

Baayen, H. R.: Word Frequency Distributions. Kluwer Academic Publishers. Dordrecht/Boston/London 2010.

Bartoň, T. - Cvrček, V. - Čermák, F. - Jelínek, T. - Petkevič, V. (2009): Statistiky češtiny. Nakladatelství Lidové

noviny, Praha 2009.

Gries, S. Th.: Quantitative Corpus Linguistics with R, Routledge 2009.

Gries, S. Th.: Statistics for Linguistics with R. A Practical Introduction. Mouton De Gruyter 2013 (2nd revised edition).

Oakes, M. P.: Statistics for Corpus Linguistics. Edinburgh University Press, Edinburgh 1998.

Volín, J. (2007): Statistické metody ve fonetickém výzkumu. Praha: Epocha.

Sylabus -
Poslední úprava: Mgr. Silvie Cinková, Ph.D. (22.05.2023)

1. Témata korpusových studií, relevance kvantitativních metod v lingvistice, stanovení hypotézy

2. Deskriptivní statistika - střední hodnota, disperze

3. Typy pravděpodobnostních rozdělení

4. Inferenční statistika

5. Korelace a regrese

6. Faktorová analýza a clusteringové metody

7. ANOVA

 
Univerzita Karlova | Informační systém UK