|
|
|
||
Poslední úprava: RNDr. Michal Kopecký, Ph.D. (12.05.2018)
|
|
||
Poslední úprava: Mgr. Jan Hučín (07.02.2020)
V průběhu semestru se studenti získají přístup na Metacentrum Hadoop Cluster a naučí se vytvářet velké výpočetní úlohy typu Map/Reduce. Zápočet bude udělena za kombinaci teoretického testu a vypracování zápočtové úlohy, zaměřené na netriviální analýzu většího datového souboru. Obsahem zkoušky bude diskuse k zápočtové úloze s významným přesahem do teoretických základů Hadoopu a jeho komponent. |
|
||
Poslední úprava: RNDr. Michal Kopecký, Ph.D. (12.05.2018)
|
|
||
Poslední úprava: doc. RNDr. Irena Holubová, Ph.D. (09.02.2021)
===================== DŮLEŽITÉ UPOZORNĚNNÍ: Od LS 2021 předmět nebude vyučován. V ZS 2021 bude nahrazen novým, povinně volitelným předmětem. =====================
1. P: Přínos Big Data technologií v Data Science úlohách C: Úvod do Hadoopu, zřízení přístupu na cluster 2. C: Technologie a znalosti pro Hadoop I. -- opakování a připomenutí (Linux, regulární výrazy, SQL) 3. P: Ukládání dat na Hadoopu -- HDFS, Hive, formáty a komprese C: Ukládání data na Hadoopu -- praktické cvičení 4. C: MapReduce paradigma a typické praktické úlohy 5. P: Spark RDD C: Technologie a znalosti pro Hadoop II. -- Python a jeho použití ve Sparku 6. C: Spark RDD -- praktické cvičení 7. P: Spark SQL C: Spark RDD a SQL -- praktické cvičení 8. C: Data Science projekt a bigdatové technologie 9. výuka se nekoná (svátek) 10.--14. Data Science projekt a bigdatové technologie |