Thesis (Selection of subject)Thesis (Selection of subject)(version: 368)
Thesis details
   Login via CAS
Nástroj pro analýzu XML dat
Thesis title in Czech: Nástroj pro analýzu XML dat
Thesis title in English: A Tool for XML Data Analysis
Academic year of topic announcement: 2006/2007
Thesis type: Bachelor's thesis
Thesis language: čeština
Department: Department of Software Engineering (32-KSI)
Supervisor: doc. RNDr. Irena Holubová, Ph.D.
Author: hidden - assigned and confirmed by the Study Dept.
Date of registration: 29.08.2006
Date of assignment: 29.08.2006
Date and time of defence: 15.09.2009 00:00
Date of electronic submission:15.09.2009
Date of proceeded defence: 15.09.2009
Opponents: doc. Mgr. Martin Nečaský, Ph.D.
 
 
 
Guidelines
Cílem práce je implementace nástroje umožňujícího provádět analýzy daných XML dokumentů, DTD a schémat v jazyce XML Schema s důrazem na snadnou rozšiřitelnost a maximální možnou parametrizovatelnost. V první fázi je třeba provést analýzu a zhodnocení existujících prací s podobným zaměřením. Jádrem práce je pak návrh a implementace vlastního nástroje, který by měl z této analýzy vycházet a zohledňovat zjištěné nedostatky.
Výsledný program by měl zahrnovat:
- netriviální, maximálně parametrizovatelnou sadu statistik, které lze nad XML daty provádět (např. počet, průměr, medián apod. zvolených konstruktů, hloubka / šířka dokumentu, max. přípustná cesta, max. přípustný cyklus DTD / schématu, rekurze, fan-in / fan-out, nedeterminismus, ...),
- přehledné grafické zobrazení vstupních XML dokumentů, DTD a XML schémat,
- tabulkové a grafové zobrazení výsledků,
- možnost srovnání výsledků odpovídajících si statistik pro XML dokumenty a jejich schémata,
- ukládání výsledků a možnost následného doplnění o nové dokumenty.
Program by měl být dále schopen téměř plně podporovat specifikace jazyků XML, DTD a XML Schema a efektivně zpracovávat i velké dokumenty. Nedílnou součástí práce bude programátorská a uživatelská dokumentace.
References
Mlýnková, I. - Pokorný, J. - Richta, K. - Toman, K. - Toman, V.: Technologie XML. Skripta. Karlova Univerzita, Praha, Česká republika, září 2006.

World Wide Web Consortium - W3C (http://www.w3.org/)

Mlynkova, I. - Toman, K. - Pokorný, J.: Statistical Analysis of Real XML Data Collections. Technical report 2006/5. Charles University, Prague, Czech Republic, June 2006. (http://kocour.ms.mff.cuni.cz/~mlynkova/doc/tr2006-5.pdf)
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html