CSV file validator according to the CSV on the Web W3C recommendations
Název práce v češtině: | Validátor CSV souborů dle W3C doporučení CSV on the Web |
---|---|
Název v anglickém jazyce: | CSV file validator according to the CSV on the Web W3C recommendations |
Klíčová slova: | CSV|JSON-LD|W3C|web|validátor|OTAVA |
Klíčová slova anglicky: | CSV|JSON-LD|W3C|web|validator|OTAVA |
Akademický rok vypsání: | 2021/2022 |
Typ práce: | diplomová práce |
Jazyk práce: | angličtina |
Ústav: | Katedra softwarového inženýrství (32-KSI) |
Vedoucí / školitel: | RNDr. Jakub Klímek, Ph.D. |
Řešitel: | skrytý - zadáno a potvrzeno stud. odd. |
Datum přihlášení: | 13.01.2022 |
Datum zadání: | 13.01.2022 |
Datum potvrzení stud. oddělením: | 29.03.2022 |
Datum a čas obhajoby: | 14.02.2024 09:00 |
Datum odevzdání elektronické podoby: | 10.01.2024 |
Datum odevzdání tištěné podoby: | 10.01.2024 |
Datum proběhlé obhajoby: | 14.02.2024 |
Oponenti: | RNDr. Martin Svoboda, Ph.D. |
Zásady pro vypracování |
The CSV on the Web W3C recommendations specify, how to describe CSV files published on the Web using JSON-LD descriptors containing important metadata, such as column names, data types and more.
The goal of this thesis is to implement a validator of CSV files based on the CSV on the Web W3C recommendations [1][2]. Although there already are some implementations [3][6], they are insufficiently maintained and hard to use. The student will: - Get familiar with CSV on the Web [1][2][3] and JSON-LD [5] - Study current implementations [3][4][6] - Design the validator architecture, so that it is easily extensible with additional validation rules - Implement the validator as a Java library, including a reasonable subset of validation rules, ideally a complete set according to the CSVW validation report. - Implement a command line and a web service runner - Represent the validation results in RDF and CSV - Evaluate the implemented validator on a given set of tests [4] against other implementations |
Seznam odborné literatury |
[1] Model for Tabular Data and Metadata on the Web, W3C, https://www.w3.org/TR/2015/REC-tabular-data-model-20151217/
[2] Metadata Vocabulary for Tabular Data, W3C, https://www.w3.org/TR/2015/REC-tabular-metadata-20151217/ [3] csvlint.io, Open Data Institute, https://github.com/theodi/csvlint.rb [4] CSVW Implementation Report, W3C, http://w3c.github.io/csvw/publishing-snapshots/PR-earl/earl.html [5] JSON for Linking Data, https://json-ld.org/ [6] Validátor CSV souboru dle W3C doporučení CSV on the Web, Vojtěch Malý, FIT ČVUT, https://dspace.cvut.cz/bitstream/handle/10467/82671/F8-DP-2019-Maly-Vojtech-thesis.pdf |