Last update: RNDr. Michal Kopecký, Ph.D. (09.09.2020)
The goal of the Data Management course is to give an overview of commonly used operations and techniques in a typical data processing process.
This includes data retrieval, cleaning, transformation, validation, catalogization, versioning, documentation, publication via API, integration, search, compression, encryption, and working with large and distributed data.
Last update: RNDr. Filip Zavoral, Ph.D. (10.02.2023)
Cílem předmětu je seznámit studenty se základy práce s daty a s běžnými operacemi v typickém procesu
zpracování dat. To zahrnuje získání dat, jejich čištění, transformace, validace, katalogizace, verzování, popis,
zpřístupnění skrze API, integraci, vyhledávání, kompresi, šifrování a práci s velkými a distribuovanými daty.
Course completion requirements -
Last update: Mgr. Petr Škoda, Ph.D. (16.01.2024)
During the semester there will be homework assignments for credit.
The final exam is a written test.
Last update: Mgr. Petr Škoda, Ph.D. (16.01.2024)
V průběhu semestru jsou postupně zadávány a hodnoceny domácí úkoly, za které je zápočet.
Zkouška je formou písemného testu.
Requirements to the exam -
Last update: Mgr. Petr Škoda, Ph.D. (04.08.2020)
Getting homework credit is a prerequisite for the final exam.
Last update: Mgr. Petr Škoda, Ph.D. (04.08.2020)
Získání zápočtu je nutnou podmínkou k účasti na závěrečné zkoušce.
Syllabus -
Last update: Mgr. Petr Škoda, Ph.D. (04.08.2020)
Data types and models
Data preprocessing
Data catalogization, metadata, data versioning
Data integration
Data vocabulary, ontology
Data APIs
Text search
Information theory
Data encoding and compression
Encryption and ensuring integrity
Management of distributed and large data
Last update: Mgr. Petr Škoda, Ph.D. (04.08.2020)
Datové typy a modely
Předzpracování dat
Katalogizace dat, metadata, verzování dat
Integrace dat
Datový slovník, popis významu dat, ontologie
Datová API
Vyhledávání v textových datech
Teorie informace
Kódování a komprese dat
Šifrování a zajištění integrity
Management distribuovaných a velkých dat
Entry requirements -
Last update: Mgr. Petr Škoda, Ph.D. (27.04.2021)
The course expects working knowledge from NPRG036 (Data Formats) course.
Last update: Mgr. Petr Škoda, Ph.D. (27.04.2021)
Předmět předpokládá znalosti přednášené v NPRG036 (Datové formáty).