Přednáška se bude zabývat teoretickými základy moderních Big Data technologií a praktickým přístupem ke zpracováni velkých datových objemů. Cvičení bude orientováno na praktické vyzkoušeni jednotlivých technologií na rozsahlých realných datech.
V rámci předmětu bude student realizovat vlastní projekt v oblasti Big Data.
Syllabus - Czech
Last update: T_KSI (13.05.2013)
1. Ukladáni dat
Rozdíly mezi klasickými RDBMS, sloupcovými bázemi a NoSQL. C-store, MongoDB, CouchDB, Cassandra, HBase.
Optimalizace a efektivita přístupu k datům.
2. Zpracování dat
Zpracování proudu dat, napojení datawarehouse systému: Linkedin/Kafka, Twitter/Storm.
Dávková zpracování dat: problematika Hadoop-u, efektivita zpracování.