Validátor CSV súborov podľa odporúčaní CSV on the Web
Thesis title in thesis language (Slovak): | Validátor CSV súborov podľa odporúčaní CSV on the Web |
---|---|
Thesis title in Czech: | Validátor CSV souborů dle W3C doporučení CSV on the Web |
Thesis title in English: | CSV file validator according to the CSV on the Web W3C recommendations |
Key words: | CSV|JSON-LD|Validácia dát|web |
English key words: | CSV|JSON-LD|web|validator |
Academic year of topic announcement: | 2022/2023 |
Thesis type: | Bachelor's thesis |
Thesis language: | slovenština |
Department: | Department of Software Engineering (32-KSI) |
Supervisor: | RNDr. Jakub Klímek, Ph.D. |
Author: | Michal Kolcun - assigned and confirmed by the Study Dept. |
Date of registration: | 28.03.2023 |
Date of assignment: | 28.03.2023 |
Confirmed by Study dept. on: | 18.07.2023 |
Date of electronic submission: | 29.04.2024 |
Opponents: | RNDr. Martin Svoboda, Ph.D. |
Guidelines |
The CSV on the Web W3C odporúčania špecifikujú to, ako popísať CSV súbory, ktoré budú publikované na internet pomocou JSON-LD deskriptorov, obsahujúce dôležité metadata, akými sú napríklad mená stĺpcov, dátové typy a podobne.
Cieľom práce je implementovať validátor CSV súborov na základe odporúčaní CSV on the Web W3C. [1][2] Napriek tomu, že už existujú hotové implementácie, sú nedostatočne zdokumentované a náročné na použitie. Študent vykoná nasledujúce: - podrobne si naštuduje a oboznámi sa s CSV on the Web [1][2][3] a JSON-LD [5] - naštuduje si už hotové implementácie [3][4][6] - navrhne architektúru validátora tak, aby bola ľahko rozšíriteľná o dodatočné validačné pravidlá - implementuje validátor ako C# knižnicu, obsahujúcu rozumnú podmnožinu validačných pravidiel, ideálne úplnú podmnožinu validačných pravidiel CSVW validation report. - implementuje command-line aplikáciu a webovú službu - umožní reprezentovať výsledok validácie ako RDF a CSV súbor - vyhodnotí implementovaný validátor na referenčných testoch [4], a výsledky porovná s už hotovými implementáciami |
References |
Zoznam literatúry:
[1] Model for Tabular Data and Metadata on the Web, W3C, https://www.w3.org/TR/2015/REC-tabular-data-model-20151217/ [2] Metadata Vocabulary for Tabular Data, W3C, https://www.w3.org/TR/2015/REC-tabular-metadata-20151217/ [3] csvlint.io, Open Data Institute, https://github.com/theodi/csvlint.rb [4] CSVW Implementation Report, W3C, http://w3c.github.io/csvw/publishing-snapshots/PR-earl/earl.html [5] JSON for Linking Data, https://json-ld.org/ [6] Validátor CSV souboru dle W3C doporučení CSV on the Web, Vojtěch Malý, FIT ČVUT, https://dspace.cvut.cz/bitstream/handle/10467/82671/F8-DP-2019-Maly-Vojtech-thesis.pdf |