Thesis (Selection of subject)Thesis (Selection of subject)(version: 368)
Thesis details
   Login via CAS
Validátor CSV súborov podľa odporúčaní CSV on the Web
Thesis title in thesis language (Slovak): Validátor CSV súborov podľa odporúčaní CSV on the Web
Thesis title in Czech: Validátor CSV souborů dle W3C doporučení CSV on the Web
Thesis title in English: CSV file validator according to the CSV on the Web W3C recommendations
Key words: CSV|JSON-LD|Validácia dát|web
English key words: CSV|JSON-LD|web|validator
Academic year of topic announcement: 2022/2023
Thesis type: Bachelor's thesis
Thesis language: slovenština
Department: Department of Software Engineering (32-KSI)
Supervisor: RNDr. Jakub Klímek, Ph.D.
Author: Michal Kolcun - assigned and confirmed by the Study Dept.
Date of registration: 28.03.2023
Date of assignment: 28.03.2023
Confirmed by Study dept. on: 18.07.2023
Date of electronic submission:29.04.2024
Opponents: RNDr. Martin Svoboda, Ph.D.
 
 
 
Guidelines
The CSV on the Web W3C odporúčania špecifikujú to, ako popísať CSV súbory, ktoré budú publikované na internet pomocou JSON-LD deskriptorov, obsahujúce dôležité metadata, akými sú napríklad mená stĺpcov, dátové typy a podobne.
Cieľom práce je implementovať validátor CSV súborov na základe odporúčaní CSV on the Web W3C. [1][2]
Napriek tomu, že už existujú hotové implementácie, sú nedostatočne zdokumentované a náročné na použitie.
Študent vykoná nasledujúce:
- podrobne si naštuduje a oboznámi sa s CSV on the Web [1][2][3] a JSON-LD [5]
- naštuduje si už hotové implementácie [3][4][6]
- navrhne architektúru validátora tak, aby bola ľahko rozšíriteľná o dodatočné validačné pravidlá
- implementuje validátor ako C# knižnicu, obsahujúcu rozumnú podmnožinu validačných pravidiel, ideálne úplnú podmnožinu validačných pravidiel CSVW validation report.
- implementuje command-line aplikáciu a webovú službu
- umožní reprezentovať výsledok validácie ako RDF a CSV súbor
- vyhodnotí implementovaný validátor na referenčných testoch [4], a výsledky porovná s už hotovými implementáciami
References
Zoznam literatúry:
[1] Model for Tabular Data and Metadata on the Web, W3C, https://www.w3.org/TR/2015/REC-tabular-data-model-20151217/
[2] Metadata Vocabulary for Tabular Data, W3C, https://www.w3.org/TR/2015/REC-tabular-metadata-20151217/
[3] csvlint.io, Open Data Institute, https://github.com/theodi/csvlint.rb
[4] CSVW Implementation Report, W3C, http://w3c.github.io/csvw/publishing-snapshots/PR-earl/earl.html
[5] JSON for Linking Data, https://json-ld.org/
[6] Validátor CSV souboru dle W3C doporučení CSV on the Web, Vojtěch Malý, FIT ČVUT, https://dspace.cvut.cz/bitstream/handle/10467/82671/F8-DP-2019-Maly-Vojtech-thesis.pdf
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html