Schema Inference for NoSQL Databases
| Název práce v češtině: | Odvozování schématu v NoSQL databázích |
|---|---|
| Název v anglickém jazyce: | Schema Inference for NoSQL Databases |
| Klíčová slova: | Odvozování schématu|NoSQL databáze|Dokumentová datová úložiště|JSON |
| Klíčová slova anglicky: | Schema inference|NoSQL databases|Document-based data stores|JSON |
| Akademický rok vypsání: | 2020/2021 |
| Typ práce: | diplomová práce |
| Jazyk práce: | angličtina |
| Ústav: | Katedra softwarového inženýrství (32-KSI) |
| Vedoucí / školitel: | Ing. Pavel Koupil, Ph.D. |
| Řešitel: | skrytý - zadáno a potvrzeno stud. odd. |
| Datum přihlášení: | 14.10.2020 |
| Datum zadání: | 16.10.2020 |
| Datum potvrzení stud. oddělením: | 30.10.2020 |
| Datum a čas obhajoby: | 13.09.2021 09:00 |
| Datum odevzdání elektronické podoby: | 21.07.2021 |
| Datum odevzdání tištěné podoby: | 22.07.2021 |
| Datum proběhlé obhajoby: | 13.09.2021 |
| Oponenti: | RNDr. Martin Svoboda, Ph.D. |
| Zásady pro vypracování |
| Many NoSQL database management systems do not require an explicit schema for the data they store. Nevertheless, application developers must maintain at least the so-called implicit schema. In certain situations, however, the presence of an explicit schema is still necessary, and so it makes sense to propose methods capable of schema inference just from the structure of the available data.
Although many schema inference algorithms have already been proposed, they suffer from various drawbacks. The author first performs an analysis and comparison of selected existing approaches, in particular for JSON document-oriented NoSQL databases. Based on it, a novel approach will be proposed and its prototype implementation then experimentally compared with respect to the selected approaches. |
| Seznam odborné literatury |
| 1) Čontoš, P. - Svoboda, M.: JSON Schema Inference Approaches. CoMoNoS@ER '20. Springer 2020.
2) Baazizi, M.A., Colazzo, D., Ghelli, G., Sartiani, C.: Parametric Schema Inference for Massive JSON Datasets. The VLDB Journal 28(4), 497–521 (2019). 3) Cánovas Izquierdo, J.L., Cabot, J.: Discovering Implicit Schemas in JSON Data. In: International Conference on Web Engineering. pp. 68–83. Springer Berlin Heidelberg (2013). https://doi.org/10.1007/978-3-642-39200-9 8 4) Frozza, A.A., dos Santos Mello, R., da Costa, F.d.S.: An Approach for Schema Extraction of JSON and Extended JSON Document Collections. In: IRI 2018. pp. 356–363 (2018). https://doi.org/10.1109/IRI.2018.00060 5) Klettke, M., Sto ̈rl, U., Scherzinger, S.: Schema Extraction and Structural Outlier Detection for JSON-based NoSQL Data Stores. In: Datenbanksysteme fu ̈r Business, Technologie und Web (BTW 2015). pp. 425–444 (2015) 6) Sevilla Ruiz, D., Morales, S.F., Garc ́ıa Molina, J.: Inferring Versioned Schemas from NoSQL Databases and Its Applications. In: Conceptual Modeling. pp. 467-480. Springer (2015). https://doi.org/10.1007/978-3-319-25264-3 35 7) Wang, L., Zhang, S., Shi, J., Jiao, L., Hassanzadeh, O., Zou, J., Wangz, C.: Schema Management for Document Stores. Proc. VLDB Endow. 8(9), 922–933 (May 2015). https://doi.org/10.14778/2777598.2777601 |
- zadáno a potvrzeno stud. odd.