The goal of the Data Management course is to give an overview of commonly used operations and techniques in a typical data processing process.
This includes data retrieval, cleaning, transformation, validation, catalogization, versioning, documentation, publication via API, integration, search, compression, encryption, and working with large and distributed data.
Last update: Kopecký Michal, RNDr., Ph.D. (09.09.2020)
Cílem předmětu je seznámit studenty se základy práce s daty a s běžnými operacemi v typickém procesu
zpracování dat. To zahrnuje získání dat, jejich čištění, transformace, validace, katalogizace, verzování, popis,
zpřístupnění skrze API, integraci, vyhledávání, kompresi, šifrování a práci s velkými a distribuovanými daty.
Last update: Zavoral Filip, RNDr., Ph.D. (10.02.2023)
Course completion requirements -
During the semester there will be homework assignments for credit.
The final exam is a written test.
Last update: Škoda Petr, Mgr., Ph.D. (16.01.2024)
V průběhu semestru jsou postupně zadávány a hodnoceny domácí úkoly, za které je zápočet.
Zkouška je formou písemného testu.
Last update: Škoda Petr, Mgr., Ph.D. (16.01.2024)
Requirements to the exam -
Getting homework credit is a prerequisite for the final exam.
Last update: Škoda Petr, Mgr., Ph.D. (04.08.2020)
Získání zápočtu je nutnou podmínkou k účasti na závěrečné zkoušce.
Last update: Škoda Petr, Mgr., Ph.D. (04.08.2020)
Syllabus -
The role of data engineering
OLTP vs. OLAP
Data cube and related operations
Business intelligence
Data marketplace, data warehouse, data lake, and data contracts
Data warehouse modeling
Data pipeline (ETL) and data processing workflows
Data lineage and provenance
Data quality, dimensions, and metrics
Frameworks for data management and data governance
Methods for trustworthy and efficient data sharing