PředmětyPředměty(verze: 835)
Předmět, akademický rok 2018/2019
   Přihlásit přes CAS
Teoretické základy statistického vyhodnocování jazykových dat v R - NPFL111
Anglický název: Theory of Statistical Analysis in R for Linguists
Zajišťuje: Ústav formální a aplikované lingvistiky (32-UFAL)
Fakulta: Matematicko-fyzikální fakulta
Platnost: od 2016
Semestr: letní
E-Kredity: 3
Rozsah, examinace: letní s.:2/0 Zk [hodiny/týden]
Počet míst: neomezen
Minimální obsazenost: neomezen
Stav předmětu: vyučován
Jazyk výuky: čeština, angličtina
Způsob výuky: prezenční
Garant: Mgr. Silvie Cinková, Ph.D.
Třída: DS, matematická lingvistika
Informatika Mgr. - Matematická lingvistika
Kategorizace předmětu: Informatika > Počítačová a formální lingvistika
Anotace -
Poslední úprava: T_UFAL (13.05.2014)

Pokročilejší zájemci o korpusovou lingvistiku, kteří absolvovali libovolný základní seminář práce s korpusy, mohou v rámci tohoto semináře prohloubit svoje znalosti statistického zpracování dat. Kurs je zaměřen jak na statistickou teorii (zejména otázky týkající se korpusové lingvistiky a specifických rozdělení jazykových dat) i na praktické zvládnutí nástrojů na provádění výpočtu (zejm. R). Kurs předpokládá uživatelskou znalost práce s PC.
Literatura -
Poslední úprava: T_UFAL (13.05.2014)

Baayen, H. R.: Analyzing Linguistic Data, Cambridge University Press, Cambridge 2008.

Baayen, H. R.: Word Frequency Distributions. Kluwer Academic Publishers. Dordrecht/Boston/London 2010.

Bartoň, T. - Cvrček, V. - Čermák, F. - Jelínek, T. - Petkevič, V. (2009): Statistiky češtiny. Nakladatelství Lidové

noviny, Praha 2009.

Gries, S. Th.: Quantitative Corpus Linguistics with R, Routledge 2009.

Gries, S. Th.: Statistics for Linguistics with R. A Practical Introduction. Mouton De Gruyter 2013 (2nd revised edition).

Oakes, M. P.: Statistics for Corpus Linguistics. Edinburgh University Press, Edinburgh 1998.

Volín, J. (2007): Statistické metody ve fonetickém výzkumu. Praha: Epocha.

Sylabus -
Poslední úprava: T_UFAL (13.05.2014)

1. Témata korpusových studií, relevance kvantitativních metod v lingvistice, stanovení hypotézy

2. Základní funkce v R:

  • načítání souborů, zápis do souborů, ukládání
  • funkce a argumenty
  • vektory, faktory, seznamy, data frames: generování, čtení, ukládání, editace
  • navigace v datech, regulární výrazy
  • Deskriptivní statistika - základní pojmy a funkce v R

 
Univerzita Karlova | Informační systém UK