Nástroj pro analýzu XML dat
Thesis title in Czech: | Nástroj pro analýzu XML dat |
---|---|
Thesis title in English: | A Tool for XML Data Analysis |
Academic year of topic announcement: | 2006/2007 |
Thesis type: | Bachelor's thesis |
Thesis language: | čeština |
Department: | Department of Software Engineering (32-KSI) |
Supervisor: | doc. RNDr. Irena Holubová, Ph.D. |
Author: | hidden - assigned and confirmed by the Study Dept. |
Date of registration: | 29.08.2006 |
Date of assignment: | 29.08.2006 |
Date and time of defence: | 15.09.2009 00:00 |
Date of electronic submission: | 15.09.2009 |
Date of proceeded defence: | 15.09.2009 |
Opponents: | doc. Mgr. Martin Nečaský, Ph.D. |
Guidelines |
Cílem práce je implementace nástroje umožňujícího provádět analýzy daných XML dokumentů, DTD a schémat v jazyce XML Schema s důrazem na snadnou rozšiřitelnost a maximální možnou parametrizovatelnost. V první fázi je třeba provést analýzu a zhodnocení existujících prací s podobným zaměřením. Jádrem práce je pak návrh a implementace vlastního nástroje, který by měl z této analýzy vycházet a zohledňovat zjištěné nedostatky.
Výsledný program by měl zahrnovat: - netriviální, maximálně parametrizovatelnou sadu statistik, které lze nad XML daty provádět (např. počet, průměr, medián apod. zvolených konstruktů, hloubka / šířka dokumentu, max. přípustná cesta, max. přípustný cyklus DTD / schématu, rekurze, fan-in / fan-out, nedeterminismus, ...), - přehledné grafické zobrazení vstupních XML dokumentů, DTD a XML schémat, - tabulkové a grafové zobrazení výsledků, - možnost srovnání výsledků odpovídajících si statistik pro XML dokumenty a jejich schémata, - ukládání výsledků a možnost následného doplnění o nové dokumenty. Program by měl být dále schopen téměř plně podporovat specifikace jazyků XML, DTD a XML Schema a efektivně zpracovávat i velké dokumenty. Nedílnou součástí práce bude programátorská a uživatelská dokumentace. |
References |
Mlýnková, I. - Pokorný, J. - Richta, K. - Toman, K. - Toman, V.: Technologie XML. Skripta. Karlova Univerzita, Praha, Česká republika, září 2006.
World Wide Web Consortium - W3C (http://www.w3.org/) Mlynkova, I. - Toman, K. - Pokorný, J.: Statistical Analysis of Real XML Data Collections. Technical report 2006/5. Charles University, Prague, Czech Republic, June 2006. (http://kocour.ms.mff.cuni.cz/~mlynkova/doc/tr2006-5.pdf) |