Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Optimization and Refinement of XML Schema Inference Approaches
Název práce v češtině: Optimization and Refinement of XML Schema Inference Approaches
Název v anglickém jazyce: Optimization and Refinement of XML Schema Inference Approaches
Klíčová slova: XML, XML schéma, odvozování schématu, odvozování regulárních výrazů z pozitivních příkladů
Klíčová slova anglicky: XML, XML schema, schema inference, inference of regular expressions from positive examples
Akademický rok vypsání: 2010/2011
Typ práce: diplomová práce
Jazyk práce: angličtina
Ústav: Katedra softwarového inženýrství (32-KSI)
Vedoucí / školitel: doc. RNDr. Irena Holubová, Ph.D.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 04.11.2010
Datum zadání: 04.11.2010
Datum a čas obhajoby: 05.09.2011 09:30
Datum odevzdání elektronické podoby:04.08.2011
Datum odevzdání tištěné podoby:05.08.2011
Datum proběhlé obhajoby: 05.09.2011
Oponenti: Mgr. Jakub Stárka, Ph.D.
 
 
 
Zásady pro vypracování
Currently there exist several works which focus on the problem of (semi)automatic inference of XML schemas for a given set of XML documents. Even though most of the approaches focus on inference of correct and optimal regular expressions, the results they output are still quite complex and unnatural.
The aim of this work is a research on various aspects of the problem. Firstly, it is necessary to analyze the existing solutions and compare and discuss their outputs. The core of the work is a proposal and implementation of own method focusing on optimization and refinement of existing approaches to obtain more realistic and natural schemas. For this purpose the approach can exploit, e.g., detailed analyses of the input data, user interaction, various metrics etc. The work will include suitable experimental results.
Seznam odborné literatury
Extensible Markup Language (XML) 1.0 (Fourth Edition). W3C Recommendation, 16 August 2006. http://www.w3.org/TR/REC-xml

W3C. W3C Technical Reports and Publications. http://www.w3.org/TR/

Mlýnková, I. - Pokorný, J. - Richta, K. - Toman, K. - Toman, V.: Technologie XML. Skripta. Karlova Univerzita, Praha, Česká republika, září 2006.

Vošta, O.: Automatická konstrukce schématu pro množinu XML dokumentů. Diplomová práce, MFF UK, 2005. http://www.ksi.mff.cuni.cz/~mlynkova/dp/Vosta.pdf

Vyhnanovská, J.: Automatic Construction of an XML Schema for a Given Set of XML Documents. Diplomová práce, MFF UK, 2009. http://www.ksi.mff.cuni.cz/~mlynkova/dp/Vyhnanovska.pdf

Ahonen, H.: Generating Grammars for Structured Documents Using Grammatical Inference Methods. Report A-1996-4, Department of Computer Science, University of Helsinki, 1996.

Christoph Neumann. Converting deterministic finite automata to regular expressions. 2005.

Yo-Sub Han and Derick Wood. Obtaining shorter regular expressions from finite-state automata. Theor. Comput. Sci., 370(1-3):110?120, 2007.
 
Univerzita Karlova | Informační systém UK