PředmětyPředměty(verze: 845)
Předmět, akademický rok 2018/2019
   Přihlásit přes CAS
Integrace a kvalita dat - NSWI144
Anglický název: Data Integration and Quality
Zajišťuje: Katedra softwarového inženýrství (32-KSI)
Fakulta: Matematicko-fyzikální fakulta
Platnost: od 2018 do 2019
Semestr: zimní
E-Kredity: 4
Rozsah, examinace: zimní s.:2/1 Z+Zk [hodiny/týden]
Počet míst: neomezen
Minimální obsazenost: neomezen
Stav předmětu: vyučován
Jazyk výuky: čeština, angličtina
Způsob výuky: prezenční
Další informace: https://jakub.klímek.com/nswi144
Poznámka: povolen pro zápis po webu
Garant: RNDr. Jakub Klímek, Ph.D.
Třída: Informatika Mgr. - Softwarové systémy
Kategorizace předmětu: Informatika > Softwarové inženýrství
Anotace -
Poslední úprava: RNDr. Michal Kopecký, Ph.D. (28.12.2018)
Studenti se seznámí s problémy datové integrace a přístupy k jejich řešení zejména pomocí webových technologií. Celý integrační proces si vyzkouší na vybraných otevřených datech s pomocí open-source nástrojů. Následně se seznámí s problematikou datové kvality, s jejími dimenzemi a s přístupy k jejímu měření, vyhodnocení a zlepšování.
Podmínky zakončení předmětu -
Poslední úprava: RNDr. Jakub Klímek, Ph.D. (07.06.2019)

Pro přihlášení ke zkoušce je nutné mít zápočet.

Zápočet lze dostat za splnění semestrální práce k termínu stanovenému cvičícím. Povaha kontroly studia předmětu vylučuje opravné termíny zápočtu.

Literatura
Poslední úprava: RNDr. Jakub Klímek, Ph.D. (02.10.2017)

[1] C. Batini and M. Scannapieco. Data Quality: Concepts, Methodologies and Techniques (Data-Centric Systems and Applications). Springer-Verlag New York, Inc., Secaucus, NJ, USA, 2006.

[2] J. Bleiholder and F. Naumann. Data fusion. ACM Comput. Surv., 41(1):1:1-1:41, Jan. 2009.

[3] Tom Heath and Christian Bizer (2011) Linked Data: Evolving the Web into a Global Data Space (1st edition). Synthesis Lectures on the Semantic Web: Theory and Technology, 1:1, 1-136. Morgan & Claypool.

[4] C. Batini, C. Cappiello, C. Francalanci, and A. Maurino. Methodologies for Data Quality Assessment and Improvement. ACM Comput. Surv., 41(3):1- 52, 2009.

[5] T. Berners-Lee. Linked Data - Design Issues. https://www.w3.org/DesignIssues/LinkedData.html

[6] L. Dodds, I. Davis - Linked Data Patterns. http://patterns.dataincubator.org/book/

Sylabus -
Poslední úprava: RNDr. Michal Kopecký, Ph.D. (28.12.2018)

1. Publikace a konzumace dat na Webu dle konceptu propojených dat (Linked Data). Linked Open Data cloud. Praktické ukázky.

2. Datová integrace, problémy a řešení pomocí webových technologií.

3. Integrace otevřených dat na Webu a nástroje k tomu určené.

4. Praktická aplikace získaných znalostí na vybraná reálná otevřená data na Webu - studenti navrhnou integrační proces, analyzují důležité dimenze datové kvality, navrhnou metriky pro kvantifikaci a zvýšení datové kvality vybraných otevřených dat na Webu.

5. Datová kvalita, dimenze datové kvality, metriky. Metodologie a nástroje pro určování datové kvality.

6. Dimenze a metriky datové kvality důležité pro otevřená data publikovaná na Webu. Typické problémy datové kvality současných datových zdrojů na Webu. Metody pro zvýšení datové kvality.

 
Univerzita Karlova | Informační systém UK