Last update: RNDr. Michal Kopecký, Ph.D. (12.05.2018)
The aim of the course is to provide and introduction to the approaches for efficient storing and querying of Big Data.
The course will familiarize students with a wide range of related concepts and technologies and provide a deeper insight into new types of database systems.
For each type of databases, basic principles and techniques as well as practical examples will be introduced.
In the labs, the students will put into operation different types of databases and test their functionality using small applications.
Last update: RNDr. Michal Kopecký, Ph.D. (12.05.2018)
Cílem předmětu je poskytnout úvod do problematiky efektivního ukládání a dotazování velkých dat (Big Data).
Předmět seznámí studenty se širokou škálou souvisejících pojmů a technologií a současně poskytne hlubší vhled do jednotlivých nových typů databázových systémů.
U každého typu databází budou uvedeny základní principy a používané techniky i praktické příklady.
V rámci cvičení si studenti sami vyzkouší zprovoznit vybrané typy databází a otestují jejich funkcionalitu na vlastních menších aplikacích.
Course completion requirements -
Last update: RNDr. Michal Kopecký, Ph.D. (22.05.2020)
See https://www.ksi.mff.cuni.cz/~holubova/NDBI040/
Last update: RNDr. Michal Kopecký, Ph.D. (22.05.2020)
Viz https://www.ksi.mff.cuni.cz/~holubova/NDBI040/
Literature -
Last update: RNDr. Michal Kopecký, Ph.D. (12.05.2018)
Holubova I., Kosek J., Minarik K., Novak D.: Big Data a NoSQL databáze. Grada 2015. ISBN: 978-80-247-5466-6
Pramod J. Sadalage - Martin Fowler: NoSQL Distilled: A Brief Guide to the Emerging World of Polyglot Persistence
Eric Redmond - Jim R. Wilson: Seven Databases in Seven Weeks: A Guide to Modern Databases and the NoSQL Movement
Sherif Sakr - Eric Pardede: Graph Data Management: Techniques and Applications
Jeffrey Dean and Sanjay Ghemawat: MapReduce: Simplified Data Processing on Large Clusters, Google, Inc.
Hadoop: The Definitive Guide, by Tom White, 2nd edition, Oreilly’s, 2010
Carlyna Bondiombouy, Patrick Valduriez. Query Processing in Multistore Systems: an overview. [Research Report] RR-8890, INRIA Sophia Antipolis - Méditerranée. 2016, pp.38.
Last update: RNDr. Michal Kopecký, Ph.D. (12.05.2018)
Holubova I., Kosek J., Minarik K., Novak D.: Big Data a NoSQL databáze. Grada 2015. ISBN: 978-80-247-5466-6
Pramod J. Sadalage - Martin Fowler: NoSQL Distilled: A Brief Guide to the Emerging World of Polyglot Persistence
Eric Redmond - Jim R. Wilson: Seven Databases in Seven Weeks: A Guide to Modern Databases and the NoSQL Movement
Sherif Sakr - Eric Pardede: Graph Data Management: Techniques and Applications
Jeffrey Dean and Sanjay Ghemawat: MapReduce: Simplified Data Processing on Large Clusters, Google, Inc.
Hadoop: The Definitive Guide, by Tom White, 2nd edition, Oreilly’s, 2010
Carlyna Bondiombouy, Patrick Valduriez. Query Processing in Multistore Systems: an overview. [Research Report] RR-8890, INRIA Sophia Antipolis - Méditerranée. 2016, pp.38.
Syllabus -
Last update: doc. RNDr. Irena Holubová, Ph.D. (04.05.2022)
Relational data model, relational databases. Historical overview of alternative data models and database systems.
Introduction to Big Data (history, features, data models).
Basic principles of Big Data Management (CAP Theorem, distribution, scaling, replication, transactions in a distributed environment, ...).
Overview and classification of database systems and technologies for efficient management and processing of Big Data.
Distributed file systems.
MapReduce - principle, properties, critique, alternative approaches.
NoSQL databases (key / value, column, document).
Graph data and graph databases.
Data with multiple models. Multi-model databases. Polystores.
SQL language in the world of Big Data. NewSQL database.
Other types of modern databases (array databases, ...).
Last update: doc. RNDr. Irena Holubová, Ph.D. (04.05.2022)
Relační model dat, relační databáze. Historický přehled alternativních datových modelů a databázových systémů.
Úvod do problematiky Big Data (historie, vlastnosti, datové modely).
Základní principy Big Data managementu (CAP theorem, distribuce, škálování, replikace, transakce v distribuovaném prostředí, ...).
Přehled a klasifikace databázových systémů a technologií pro efektivní správu a zpracování Big Data.