PředmětyPředměty(verze: 945)
Předmět, akademický rok 2023/2024
   Přihlásit přes CAS
Zpracování a analýza dat pro humanitní a společenské vědy - NPFL143
Anglický název: Data Processing and Analysis for the Humanities
Zajišťuje: Ústav formální a aplikované lingvistiky (32-UFAL)
Fakulta: Matematicko-fyzikální fakulta
Platnost: od 2023
Semestr: letní
E-Kredity: 2
Rozsah, examinace: letní s.:0/2, Z [HT]
Počet míst: neomezen
Minimální obsazenost: neomezen
4EU+: ne
Virtuální mobilita / počet míst pro virtuální mobilitu: ne
Stav předmětu: nevyučován
Jazyk výuky: čeština
Způsob výuky: prezenční
Způsob výuky: prezenční
Garant: RNDr. Martin Holub, Ph.D.
Třída: Informatika Mgr. - volitelný
Kategorizace předmětu: Informatika > Počítačová a formální lingvistika
Výsledky anket   Termíny zkoušek   Rozvrh   Nástěnka   
Anotace -
Poslední úprava: RNDr. Jiří Mírovský, Ph.D. (24.05.2023)
Počítačové zpracování dat se stalo metodologickým předpokladem velké většiny vědních oborů, včetně humanitních a společenskovědních. Výuka probíhá formou názorných příkladů a vede studenty od úplných základů práce s daty k řešení praktických úloh pomocí nástrojů implementovaných v softwarovém prostředí R. Tento kurz nepředpokládá žádné předchozí znalosti programování a je určen především studentům humanitních a společenskovědních oborů, a to na jakémkoliv stupni (Bc/Mgr/PhD).
Cíl předmětu -
Poslední úprava: RNDr. Jiří Mírovský, Ph.D. (24.05.2023)

Studenti se naučí samostatně využívat systém R ke zpracování a analýze dat z oblasti humanitních a společenských věd. Kurz poskytuje systematickou technickou podporu pro zvládnutí základů umělé inteligence v rámci navazujícího předmětu "Umělá inteligence pro humanitní a společenské vědy" [NPFL 142].

Podmínky zakončení předmětu -
Poslední úprava: RNDr. Martin Holub, Ph.D. (06.06.2023)

Předmět bude ukončen písemným zápočtovým testem. Docházka na cvičení je povinná. Zápočet se uděluje za aktivní práci během celého semestru a odevzdávání průběžných domácích úkolů.

Literatura -
Poslední úprava: RNDr. Martin Holub, Ph.D. (06.06.2023)
  • Grolemund, Garrett and Hadley Wickham: R for Data Science: Import, Tidy, Transform, Visualize, and Model Data. O'Reilly Media, 2016. [https://r4ds.hadley.nz/]
  • Gonick, Larry and Woollcott Smith. The Cartoon Guide to Statistics. Harper Resource. 2005.
  • Arnold, Taylor and Lauren Tilton: Humanities Data in R. Exploring Networks, Geospatial Data, Images, and Text. Springer, 2015. [https://link.springer.com/book/10.1007/978-3-319-20702-5]

Sylabus -
Poslední úprava: RNDr. Martin Holub, Ph.D. (06.06.2023)
Základy používání systému R, elementární programovací dovednosti
  • Datové vektory, datové tabulky, ukládání do souborů
  • Textová data a jejich zpracování
  • Nástroje z balíčku tidyverse
  • Vizualizace dat
  • Regulární výrazy

Elementární znalosti z pravděpodobnosti a statistiky

  • Teoretické a empirické pravděpodobnostní rozdělení
  • Kontingenční tabulky
  • Simulace náhodných procesů
  • Binomické a normální rozdělení
  • Používání jednoduchých statistických testů

Podpora pro experimentování s umělou inteligencí

 
Univerzita Karlova | Informační systém UK