Předměty

Váš prohlížeč nepodporuje JavaScript nebo je jeho podpora vypnutá. Některé funkce nemusejí být dostupné.

Umělá inteligence pro humanitní a společenské vědy - NPFL142

Anglický název:	Artificial Intelligence for Humanities
Zajišťuje:	Ústav formální a aplikované lingvistiky (32-UFAL)
Fakulta:	Matematicko-fyzikální fakulta
Platnost:	od 2025
Semestr:	letní
E-Kredity:	4
Rozsah, examinace:	letní s.:2/2, Z+Zk [HT]
Počet míst:	neomezen
Minimální obsazenost:	neomezen
4EU+:	ne
Virtuální mobilita / počet míst pro virtuální mobilitu:	ne
Kompetence:	data literacy
Stav předmětu:	vyučován
Jazyk výuky:	angličtina
Způsob výuky:	prezenční
Další informace:	https://ufal.mff.cuni.cz/courses/npfl142

Garant:	doc. Mgr. Barbora Vidová Hladká, Ph.D.
Vyučující:	doc. Mgr. Barbora Vidová Hladká, Ph.D.
Třída:	Informatika Mgr. - Matematická lingvistika
Kategorizace předmětu:	Informatika > Počítačová a formální lingvistika

Výsledky anket Rozvrh LS Nástěnka

Anotace -

Umělá inteligence je velmi aktuálním a sílícím trendem pronikajícím do nejrůznějších oblastí života i většiny vědních oborů, včetně humanitních a společenskovědních. Tímto kurzem reagujeme na rostoucí význam rychle se uplatňujících počítačových technologií a srozumitelnou formou představujeme technologické základy umělé inteligence. Kurz je určen především studentům humanitních a společenskovědních oborů, a to na jakémkoliv stupni (Bc/Mgr/PhD).

Poslední úprava: Mírovský Jiří, RNDr., Ph.D. (24.05.2023)

Cíl předmětu -

Studenti během kurzu získají teoretické znalosti i praktické dovednosti potřebné pro řešení praktických úloh s využitím dostupných dat a metod umělé inteligence, zejména z oblasti analýzy textů. Za tímto účelem se naučí využívat nástroje implementované v programovacím prostředí R a samostatně se orientovat v technické literatuře. Absolvent kurzu má schopnost analyzovat a zpracovat data z různých oblastí humanitních nebo společenských věd a tato data využívat pro experimentování s umělou inteligencí.

Poslední úprava: Vidová Hladká Barbora, doc. Mgr., Ph.D. (24.05.2023)

Podmínky zakončení předmětu -

Předmět bude ukončen zkouškou. Udělení zápočtu je podmínkou k připuštění ke zkoušce. Zápočet se uděluje za aktivní práci během celého semestru a odevzdávání průběžných domácích úkolů. Docházka na cvičení je povinná. Účast na přednáškách je pro pochopení obsahu cvičení a vypracování domácích úkolu de facto nezbytná.

Poslední úprava: Vidová Hladká Barbora, doc. Mgr., Ph.D. (24.05.2023)

Literatura -

Arnold, Taylor and Lauren Tilton: Humanities Data in R. Exploring Networks, Geospatial Data, Images, and Text. Springer, 2015. [https://link.springer.com/book/10.1007/978-3-319-20702-5]

Lantz, Brett: Machine Learning with R. PACKT Publishing. 2013, 2019.

Grolemund, Garrett and Hadley Wickham: R for Data Science: Import, Tidy, Transform, Visualize, and Model Data. O'Reilly Media, 2016. [https://r4ds.hadley.nz/]

Boehmke, Bradley and Brandon M. Greenwell: Hands-On Machine Learning with R. Chapman & Hall/CRC, 2019. [https://bradleyboehmke.github.io/HOML/]

Hvitfeldt, Emil and Julie Silge: Supervised Machine Learning for Text Analysis in R. CRC Press. 2022. [https://smltar.com/]

Poslední úprava: Holub Martin, RNDr., Ph.D. (06.06.2023)

Požadavky ke zkoušce -

Zkouška má písemnou a ústní část, do úvahy však bereme také úroveň zpracování průběžných domácích úkolů. Požadavky ke zkoušce odpovídají sylabu předmětu, podrobnosti jsou uvedené na webové stránce předmětu.

Poslední úprava: Vidová Hladká Barbora, doc. Mgr., Ph.D. (24.05.2023)

Sylabus -

Výuka probíhá jako demonstrace metod umělé inteligence na názorném řešení záměrně různorodých praktických úloh, jako jsou např. automatické rozpoznávání autorství, rodného jazyka, určování doby vzniku textu, předpovídání úspěšnosti reklamních kampaní, analýza textů ze sociálních sítí, marketingová analýza nákupních košíků, analýza a vizualizace sítě odkazů nebo podobnosti obrázků a různé problémy z oblasti psychometrie. Studenti jsou vedeni k samostatné analýze datových zdrojů s humanitním nebo společenskovědním obsahem a získávají znalosti potřebné k využívání metod umělé inteligence implementovaných v softwarovém prostředí R. Přitom jsou probírána zejména následující témata:

Část I – Předehra k metodám umělé inteligence

Obecné technologické principy umělé inteligence a statistického strojového učení

Historický přehled vývoje umělé inteligence z technologického a uživatelského pohledu

Statistická analýza dat

Dostupné technologie pro zpracování textových dat

Nástroje z balíčku tidyverse v prostředí R

Část II – Klasické metody statistického strojové učení

Princip učení z příkladů, klasifikace a regrese

Použití a parametrizace vybraných učících algoritmů

Shluková analýza

Vyhodnocování experimentů

Část III – Hluboké učení v neuronových sítích

Architektury neuronových sítí

Reprezentace textových dat pomocí tzv. embeddings

Trénování neuronových sítí

Poslední úprava: Holub Martin, RNDr., Ph.D. (06.06.2023)

Vstupní požadavky -

U studentů předpokládáme chuť experimentovat s umělou inteligencí, včetně neuronových sítí. Zájemci o tento kurz by měli ovládat základy práce v systému R a měli by mít alespoň elementární znalosti o systematickém zpracování a statistické analýze dat. Tyto vstupní předpoklady lze nahradit docházkou na paralelně vyučovaný kurz "Zpracování a analýza dat pro humanitní a společenské vědy" [NPFL 143].

Poslední úprava: Vidová Hladká Barbora, doc. Mgr., Ph.D. (24.05.2023)