Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 290)
Detail práce
   Přihlásit přes CAS
Nástroj pro propojování otevřených dat veřejné správy
Název práce v češtině: Nástroj pro propojování otevřených dat veřejné správy
Název v anglickém jazyce: Tool for linking open data of public administrations
Klíčová slova: otevřená data, propojená otevřená data, CSV, CSV on the Web, REST, webová služba, transformace dat
Klíčová slova anglicky: open data, linked open data, CSV, CSV on the Web, REST, web service, data transformation
Akademický rok vypsání: 2018/2019
Typ práce: bakalářská práce
Jazyk práce:
Ústav: Katedra softwarového inženýrství (32-KSI)
Vedoucí / školitel: doc. Mgr. Martin Nečaský, Ph.D.
Řešitel:
Zásady pro vypracování
Veřejná správa dnes poskytuje odborné informatické veřejnosti širokou škálu údajů v podobě otevřených dat [1][6]. Data jsou typicky poskytována v podobě CSV souborů [2]. Tato data jsou většinou dobře strojově zpracovatelná avšak integrovatelnost dat od různých poskytovatelů je často náročná. Řešením jsou tzv. propojená otevřená data dle 5* schématu otevřenosti dat, které sestavil Tim-Berners Lee, zakladatel sítě WWW [3]. Ačkoliv se propast mezi prostými CSV soubory a propojenými otevřenými daty může zdát veliká, existuje řada důvodů, proč se ji snažit překonat. Nedávným příspěvkem k této problematice je doporučení W3C CSV on the Web (CSVW) [4], které umožňuje CSV soubor obohatit o schéma, které deklarativním způsobem popisuje, jak mají být údaje v CSV souboru mapovány do podoby propojených otevřených dat. Doporučení je ale poměrně nové a uspokojivá open source implementace ještě neexistuje.

Cílem této práce je prostudovat a analyzovat možnosti CSVW pro účely popisu mapování údajů v CSV do podoby propojených otevřených dat a navrhnout a implementovat softwarový nástroj pro intepretaci mapování zapsaného pomocí CSVW a jeho vykonání. Softwarový nástroj bude otestován na reálných otevřených datech Českého statistického úřadu (např. data s výsledky voleb do Parlamentu PSP ČR 2017 [5]), příp. dalších datech dodaných vedoucím práce. Výsledný softwarový nástroj bude fungovat jako REST služba. Softwarový nástroj bude vytvořen jako open source a bude součástí
Seznam odborné literatury
[1] https://opendata.gov.cz/standardy:co-jsou-otevrena-data
[2] https://tools.ietf.org/html/rfc4180
[3] http://5stardata.info/en/
[4] https://www.w3.org/TR/tabular-data-primer/
[5] https://nkod.opendata.cz/datov%C3%A9-sady?kl%C3%AD%C4%8Dov%C3%A1+slova=v%C3%BDsledky+voleb&kl%C3%AD%C4%8Dov%C3%A1+slova=Poslaneck%C3%A1+sn%C4%9Bmovna&poskytovatel=%C4%8Cesk%C3%BD+statistick%C3%BD+%C3%BA%C5%99ad
[6] https://nkod.opendata.cz (mirror oficiálního Národního katalogu otevřených dat dostupného na https://data.gov.cz)
Předběžná náplň práce
V roce 2011 iniciovali pracovníci MFF UK vznik sdružení OpenData.cz, jehož cílem bylo propagovat myšlenky otevřených dat v prostředí veřejné správy České republiky. Od té doby se iniciativa etablovala na veřejné scéně a pomohla řadě institucí, jako je například Český telekomunikační úřad, Ministerstvo financí, Český statistický úřad, Český úřad zeměměřičský a katastrální, Česká obchodní inspekce a další, otevřít data. Otevřená data jsou data zveřejněná na Internetu v podobě datových souborů k volnému stažení a k libovolnému užití. Mohou být volně sdílena a svoji podstatou jsou tak velmi podobné principu Open Source, avšak aplikovanému na data.

V současnosti sdružení OpenData.cz úzce spolupracuje i s Odborem hlavního architekta českého eGovernmentu na Ministerstvu vnitra ČR a pomáhá zpracovávat koncepci otevřených dat, kterou se budou řídit veškeré úřady v naší zemi. Členové sdružení jsou autory informačního portálu k otevřeným datům (https://opendata.gov.cz), který oficiálně vydává a spravuje Ministerstvo vnitra ČR. Též jsou spoluautory novely Zákona č. 106/1999 Sb. o svobodném přístupu k informacím, která zavedla pojem otevřených dat do české legislativy, a která byla v roce 2017 odbornou právní porotou oceněna titulem Zákon roku. Součástí výstupů sdružení je i experimentální vývoj softwarových prototypů, jako je např. prototyp nového Národního katalogu otevřených dat dostupný na doméně https://nkod.opendata.cz, který je mirrorem oficiálního katalogu dostupného na https://data.gov.cz. V současné době je jedním z naších hlavních cílů též praktické ověření myšlenek tzv. propojených otevřených dat dle 5* schématu otevřenosti dat (http://5stardata.info/en/), které sestavil Tim-Berners Lee, zakladatel sítě WWW.

Řešitel této práce bude mít možnost spolupracovat s členy sdružení OpenData.cz. V případě úspěchu bude jeho výstup jako Open Source zařazen jako komponenta vyvíjeného prototypu nového Národního katalogu otevřených dat. S Ministerstvem vnitra pravidelně komunikujeme a prototyp by měl být v blízké budoucnosti nasazen jako oficiální uživatelské rozhraní Národního katalogu otevřených dat.
 
Univerzita Karlova | Informační systém UK