Umělá inteligence je velmi aktuálním a sílícím trendem pronikajícím do nejrůznějších oblastí života i většiny vědních
oborů, včetně humanitních a společenskovědních. Tímto kurzem reagujeme na rostoucí význam rychle se uplatňujících
počítačových technologií a srozumitelnou formou představujeme technologické základy umělé inteligence. Kurz je určen
především studentům humanitních a společenskovědních oborů, a to na jakémkoliv stupni (Bc/Mgr/PhD).
Poslední úprava: Mírovský Jiří, RNDr., Ph.D. (24.05.2023)
Artificial Intelligence is a highly topical and growing trend penetrating into various areas of life and most scientific fields,
including the humanities and social sciences. This course is a response to the increasing importance of rapidly
advancing computer technologies, and it presents the technological foundations of Artificial Intelligence in an
understandable way. The course is primarily designed for students in the humanities and social sciences at any level
(BSc/MSc/PhD).
Poslední úprava: Mírovský Jiří, RNDr., Ph.D. (24.05.2023)
Cíl předmětu -
Studenti během kurzu získají teoretické znalosti i praktické dovednosti potřebné pro řešení praktických úloh s využitím dostupných dat a metod umělé inteligence, zejména z oblasti analýzy textů. Za tímto účelem se naučí využívat nástroje implementované v programovacím prostředí R a samostatně se orientovat v technické literatuře. Absolvent kurzu má schopnost analyzovat a zpracovat data z různých oblastí humanitních nebo společenských věd a tato data využívat pro experimentování s umělou inteligencí.
Poslední úprava: Vidová Hladká Barbora, doc. Mgr., Ph.D. (24.05.2023)
During the course, students will acquire theoretical knowledge as well as practical skills necessary for solving practical tasks using available data and Artificial Intelligence methods, particularly in the field of text analysis. To this end, they will learn to use tools implemented in the R software system and independently read technical literature. Upon completion of the course, graduates will have the ability to analyze and process data from various areas of the humanities or social sciences, and use this data for experimenting with Artificial Intelligence.
Poslední úprava: Mírovský Jiří, RNDr., Ph.D. (23.05.2023)
Podmínky zakončení předmětu -
Předmět bude ukončen zkouškou. Udělení zápočtu je podmínkou k připuštění ke zkoušce. Zápočet se uděluje za aktivní práci během celého semestru a odevzdávání průběžných domácích úkolů. Docházka na cvičení je povinná. Účast na přednáškách je pro pochopení obsahu cvičení a vypracování domácích úkolu de facto nezbytná.
Poslední úprava: Vidová Hladká Barbora, doc. Mgr., Ph.D. (24.05.2023)
The course will be concluded with an exam. Obtaining the course credit is a prerequisite for taking the exam. The credit is awarded for active participation throughout the term and the submission of ongoing homework assignments. Lab session attendance is mandatory. Lecture attendance is, in fact, essential for understanding the content of the lab sessions and completing the assignments.
Poslední úprava: Mírovský Jiří, RNDr., Ph.D. (23.05.2023)
Literatura -
Arnold, Taylor and Lauren Tilton: Humanities Data in R. Exploring Networks, Geospatial Data, Images, and Text. Springer, 2015. [https://link.springer.com/book/10.1007/978-3-319-20702-5]
Lantz, Brett: Machine Learning with R. PACKT Publishing. 2013, 2019.
Grolemund, Garrett and Hadley Wickham: R for Data Science: Import, Tidy, Transform, Visualize, and Model Data. O'Reilly Media, 2016. [https://r4ds.hadley.nz/]
Boehmke, Bradley and Brandon M. Greenwell: Hands-On Machine Learning with R. Chapman & Hall/CRC, 2019. [https://bradleyboehmke.github.io/HOML/]
Hvitfeldt, Emil and Julie Silge: Supervised Machine Learning for Text Analysis in R. CRC Press. 2022. [https://smltar.com/]
Poslední úprava: Holub Martin, RNDr., Ph.D. (06.06.2023)
Arnold, Taylor and Lauren Tilton: Humanities Data in R. Exploring Networks, Geospatial Data, Images, and Text. Springer, 2015. [https://link.springer.com/book/10.1007/978-3-319-20702-5]
Lantz, Brett: Machine Learning with R. PACKT Publishing. 2013, 2019.
Grolemund, Garrett and Hadley Wickham: R for Data Science: Import, Tidy, Transform, Visualize, and Model Data. O'Reilly Media, 2016. [https://r4ds.hadley.nz/]
Boehmke, Bradley and Brandon M. Greenwell: Hands-On Machine Learning with R. Chapman & Hall/CRC, 2019. [https://bradleyboehmke.github.io/HOML/]
Hvitfeldt, Emil and Julie Silge: Supervised Machine Learning for Text Analysis in R. CRC Press. 2022. [https://smltar.com/]
Poslední úprava: Holub Martin, RNDr., Ph.D. (06.06.2023)
Požadavky ke zkoušce -
Zkouška má písemnou a ústní část, do úvahy však bereme také úroveň zpracování průběžných domácích úkolů. Požadavky ke zkoušce odpovídají sylabu předmětu, podrobnosti jsou uvedené na webové stránce předmětu.
Poslední úprava: Vidová Hladká Barbora, doc. Mgr., Ph.D. (24.05.2023)
The exam consists of a written and an oral part and we take into account the quality of ongoing homework completions as well. The examination requirements correspond to the course syllabus. More details are available on the course web site.
Poslední úprava: Mírovský Jiří, RNDr., Ph.D. (23.05.2023)
Sylabus -
Výuka probíhá jako demonstrace metod umělé inteligence na názorném řešení záměrně různorodých praktických úloh, jako jsou např. automatické rozpoznávání autorství, rodného jazyka, určování doby vzniku textu, předpovídání úspěšnosti reklamních kampaní, analýza textů ze sociálních sítí, marketingová analýza nákupních košíků, analýza a vizualizace sítě odkazů nebo podobnosti obrázků a různé problémy z oblasti psychometrie. Studenti jsou vedeni k samostatné analýze datových zdrojů s humanitním nebo společenskovědním obsahem a získávají znalosti potřebné k využívání metod umělé inteligence implementovaných v softwarovém prostředí R. Přitom jsou probírána zejména následující témata:
Část I – Předehra k metodám umělé inteligence
Obecné technologické principy umělé inteligence a statistického strojového učení
Historický přehled vývoje umělé inteligence z technologického a uživatelského pohledu
Statistická analýza dat
Dostupné technologie pro zpracování textových dat
Nástroje z balíčku tidyverse v prostředí R
Část II – Klasické metody statistického strojové učení
Princip učení z příkladů, klasifikace a regrese
Použití a parametrizace vybraných učících algoritmů
Shluková analýza
Vyhodnocování experimentů
Část III – Hluboké učení v neuronových sítích
Architektury neuronových sítí
Reprezentace textových dat pomocí tzv. embeddings
Trénování neuronových sítí
Poslední úprava: Holub Martin, RNDr., Ph.D. (06.06.2023)
The teaching is conducted through demonstrations of Artificial Intelligence methods on illustrative solutions of intentionally diverse practical tasks. These tasks include automatic authorship recognition, native language identification, text age estimation, predicting the success of advertising campaigns, analyzing texts from social media, conducting shopping cart analysis, analyzing and visualizing citation networks, visualizing image similarities, and various problems in psychometrics. Students are guided towards independent analysis of data sources from the humanities or social sciences and they acquire the knowledge necessary to use Artificial Intelligence methods implemented in the R software system. We particularly focus on the following topics:
Part I - Introduction to Artificial Intelligence methods
General technological principles of Artificial Intelligence and statistical Machine Learning
Historical overview of Artificial Intelligence development from a technological and user perspective
Statistical data analysis
Technologies available for processing textual data
Tools from the tidyverse package in the R software system
Part II - Traditional methods of statistical machine learning
Principles of learning from examples, classification and regression
Use and parameterization of selected learning algorithms
Clustering
Experiment evaluation
Part III - Deep Learning in Neural Networks
Neural Network Architecture
Representation of textual data using embeddings
Training Neural Networks
Poslední úprava: Vidová Hladká Barbora, doc. Mgr., Ph.D. (24.05.2023)
Vstupní požadavky -
U studentů předpokládáme chuť experimentovat s umělou inteligencí, včetně neuronových sítí. Zájemci o tento kurz by měli ovládat základy práce v systému R a měli by mít alespoň elementární znalosti o systematickém zpracování a statistické analýze dat. Tyto vstupní předpoklady lze nahradit docházkou na paralelně vyučovaný kurz "Zpracování a analýza dat pro humanitní a společenské vědy" [NPFL 143].
Poslední úprava: Vidová Hladká Barbora, doc. Mgr., Ph.D. (24.05.2023)
We expect students to have a willingness to experiment with Artificial Intelligence, including Neural Networks. Prospective participants of this course should have a basic understanding of working with the R system and should possess at least elementary knowledge of systematic data processing and statistical analysis. These prerequisite requirements can be fulfilled by attending the parallel course "Data Processing and Analysis for Humanities" [NPFL143].
Poslední úprava: Mírovský Jiří, RNDr., Ph.D. (23.05.2023)