PředmětyPředměty(verze: 802)
Předmět, akademický rok 2016/2017
   Přihlásit přes CAS
Integrace a kvalita dat - NSWI144
Anglický název: Data Integration and Quality
Zajišťuje: Katedra softwarového inženýrství (32-KSI)
Fakulta: Matematicko-fyzikální fakulta
Platnost: od 2015
Semestr: zimní
E-Kredity: 4
Rozsah, examinace: zimní s.:2/1 Z+Zk [hodiny/týden]
Počet míst: neomezen
Minimální obsazenost: neomezen
Stav předmětu: vyučován
Jazyk výuky: čeština, angličtina
Způsob výuky: prezenční
Další informace: http://www.ksi.mff.cuni.cz/~knap/NSWI144
Poznámka: povolen pro zápis po webu
Garant: RNDr. Tomáš Knap, Ph.D.
Třída: Informatika Mgr. - Softwarové systémy
Kategorizace předmětu: Informatika > Softwarové inženýrství
Anotace -
Poslední úprava: T_KSI (30.04.2014)

Cílem předmětu je seznámit studenty s měřením kvality integrovaných dat. V prvé části je přiblížen proces integrace dat, jeho jednotlivé kroky, typické problémy a jejich řešení. Jsou představeny konkrétní systémy a jejich přístupy pro integraci dat. Následně jsou představeny problémy kvality integrovaných dat, základní dimenze a metriky datové kvality a existující metodologie a nástroje pro měření datové kvality integrovaných dat. Jsou diskutovány konkrétní nástroje a systémy pro měření datové kvality. Studenti si na semináři vyzkouší aplikaci získaných teoretických znalostí na konkrétní r
Literatura
Poslední úprava: T_KSI (30.04.2014)

[1] C. Batini and M. Scannapieco. Data Quality: Concepts, Methodologies and Techniques (Data-Centric Systems and Applications). Springer-Verlag New York, Inc., Secaucus, NJ, USA, 2006.

[2] J. Bleiholder and F. Naumann. Data fusion. ACM Comput. Surv., 41(1):1:1-1:41, Jan. 2009.

[3] Tom Heath and Christian Bizer (2011) Linked Data: Evolving the Web into a Global Data Space (1st edition). Synthesis Lectures on the Semantic Web: Theory and Technology, 1:1, 1-136. Morgan & Claypool.

[4] C. Batini, C. Cappiello, C. Francalanci, and A. Maurino. Methodologies for Data Quality Assessment and Improvement. ACM Comput. Surv., 41(3):1- 52, 2009.

Sylabus -
Poslední úprava: T_KSI (30.04.2014)

1. Datová integrace, problémy, přístupy. Řešení konfliktů při integraci dat. Přestavení konkrétních systému pro datovou integraci.

2. Datová kvalita, dimenze datové kvality, metriky. Metodologie a nástroje pro určování datové kvality.

3. Konzumace a publikovaní otevřených dat na Webu dle konceptu Linked Data. Linked Open Data cloud. Praktické ukázky.

4. Datová integrace otevřených dat na Webu, případové studie. Nástroje pro integrace otevřených dat na Webu.

5. Dimenze a metriky datové kvality důležité pro otevřená data publikovaná na Webu, případové studie. Typické problémy datové kvality současných datových zdrojů na Webu. Metody pro zvýšení datové kvality.

6. Praktická aplikace získaných znalostí na vybraná reálná otevřená data na Webu - studenti navrhnou integračního proces, analyzují důležité dimenze datové kvality, navrhnou metriky pro kvantifikaci a zvýšení datové kvality vybraných otevřených dat na Webu.

 
Univerzita Karlova | Informační systém UK