PředmětyPředměty(verze: 811)
Předmět, akademický rok 2017/2018
   Přihlásit přes CAS
Integrace a kvalita dat - NSWI144
Anglický název: Data Integration and Quality
Zajišťuje: Katedra softwarového inženýrství (32-KSI)
Fakulta: Matematicko-fyzikální fakulta
Platnost: od 2017
Semestr: zimní
E-Kredity: 4
Rozsah, examinace: zimní s.:2/1 Z+Zk [hodiny/týden]
Počet míst: neomezen
Minimální obsazenost: neomezen
Stav předmětu: vyučován
Jazyk výuky: čeština, angličtina
Způsob výuky: prezenční
Poznámka: povolen pro zápis po webu
Garant: RNDr. Jakub Klímek, Ph.D.
Třída: Informatika Mgr. - Softwarové systémy
Kategorizace předmětu: Informatika > Softwarové inženýrství
Anotace -
Poslední úprava: T_KSI (30.04.2014)

Cílem předmětu je seznámit studenty s měřením kvality integrovaných dat. V prvé části je přiblížen proces integrace dat, jeho jednotlivé kroky, typické problémy a jejich řešení. Jsou představeny konkrétní systémy a jejich přístupy pro integraci dat. Následně jsou představeny problémy kvality integrovaných dat, základní dimenze a metriky datové kvality a existující metodologie a nástroje pro měření datové kvality integrovaných dat. Jsou diskutovány konkrétní nástroje a systémy pro měření datové kvality. Studenti si na semináři vyzkouší aplikaci získaných teoretických znalostí na konkrétní r
Podmínky zakončení předmětu -
Poslední úprava: RNDr. Jakub Klímek, Ph.D. (02.10.2017)

Pro přihlášení ke zkoušce je nutné mít zápočet.

Zápočet lze dostat za splnění semestrální práce k termínu stanovenému cvičícím. Povaha kontroly studia předmětu vylučuje opravné termíny zápočtu.

Literatura
Poslední úprava: RNDr. Jakub Klímek, Ph.D. (02.10.2017)

[1] C. Batini and M. Scannapieco. Data Quality: Concepts, Methodologies and Techniques (Data-Centric Systems and Applications). Springer-Verlag New York, Inc., Secaucus, NJ, USA, 2006.

[2] J. Bleiholder and F. Naumann. Data fusion. ACM Comput. Surv., 41(1):1:1-1:41, Jan. 2009.

[3] Tom Heath and Christian Bizer (2011) Linked Data: Evolving the Web into a Global Data Space (1st edition). Synthesis Lectures on the Semantic Web: Theory and Technology, 1:1, 1-136. Morgan & Claypool.

[4] C. Batini, C. Cappiello, C. Francalanci, and A. Maurino. Methodologies for Data Quality Assessment and Improvement. ACM Comput. Surv., 41(3):1- 52, 2009.

[5] T. Berners-Lee. Linked Data - Design Issues. https://www.w3.org/DesignIssues/LinkedData.html

[6] L. Dodds, I. Davis - Linked Data Patterns. http://patterns.dataincubator.org/book/

Sylabus -
Poslední úprava: RNDr. Jakub Klímek, Ph.D. (02.10.2017)

1. Datová integrace, problémy, přístupy. Řešení konfliktů při integraci dat. Přestavení konkrétních systému pro datovou integraci.

2. Publikace a konzumace dat na Webu dle konceptu Linked Data. Linked Open Data cloud. Praktické ukázky.

3. Integrace otevřených dat na Webu, případové studie.

4. Praktická aplikace získaných znalostí na vybraná reálná otevřená data na Webu - studenti navrhnou integračního proces, analyzují důležité dimenze datové kvality, navrhnou metriky pro kvantifikaci a zvýšení datové kvality vybraných otevřených dat na Webu.

5. Datová kvalita, dimenze datové kvality, metriky. Metodologie a nástroje pro určování datové kvality.

6. Dimenze a metriky datové kvality důležité pro otevřená data publikovaná na Webu. Typické problémy datové kvality současných datových zdrojů na Webu. Metody pro zvýšení datové kvality.

 
Univerzita Karlova | Informační systém UK