Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Linked Data Integration
Název práce v češtině: Integrade Linked Data
Název v anglickém jazyce: Linked Data Integration
Klíčová slova: Linked Data, datová integrace, datová kvalita, datové konflikty
Klíčová slova anglicky: Linked Data, data integration, data quality, conflict resolution, data fusion
Akademický rok vypsání: 2012/2013
Typ práce: diplomová práce
Jazyk práce: angličtina
Ústav: Katedra softwarového inženýrství (32-KSI)
Vedoucí / školitel: RNDr. Tomáš Knap, Ph.D.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 09.04.2013
Datum zadání: 12.04.2013
Datum potvrzení stud. oddělením: 17.04.2013
Datum a čas obhajoby: 09.09.2013 00:00
Datum odevzdání elektronické podoby:31.07.2013
Datum odevzdání tištěné podoby:01.08.2013
Datum proběhlé obhajoby: 09.09.2013
Oponenti: RNDr. Jakub Klímek, Ph.D.
 
 
 
Konzultanti: doc. Mgr. Martin Nečaský, Ph.D.
Zásady pro vypracování
One of the most important benefits of Linked Data [4] is the possibility to integrate data from multiple sources. This poses new challenges in data fusion [3], quality assessment [5], and provenance tracking [6].

The topic of the thesis is a data fusion (conflict resolution) component that would enable users to integrate and filter RDF data, estimate their quality and obtain provenance information. Data fusion component proposed may be executed at query time according to policies given by data consumers [2,5] or offline (batch mode). Data fusion will be implemented as a standalone component applicable to data represented in RDF and also deployed as part of the ODCleanStore project [1]. The thesis will also provide experimental evaluation of the proposed data fusion component and provide comparison of the proposed data fusion technique with existing data fusion techniques in relational databases.
Seznam odborné literatury
[1] ODCleanStore project, http://sourceforge.net/p/odcleanstore. Available Online.

[2] C. Bizer and R. Oldakowski. Using Context- and Content-based Trust Policies on the Semantic Web. In Proceedings of the 13th International World Wide Web conference on Alternate track papers & posters, WWW Alt. '04, pages 228-229, New York, NY, USA, 2004. ACM.

[3] P. N. Mendes, H. Mühleisen, and C. Bizer. Sieve: Linked Data Quality Assessment and Fusion. In Proceedings of the 2012 Joint EDBT/ICDT Workshops, pages 116-123, Berlin, Germany, March 2012. ACM.

[4] C. Bizer, T. Heath, and T. Berners-Lee. Linked Data - The Story So Far. International Journal on Semantic Web and Information Systems, 5(3):1-22, 2009.

[5] C. Bizer. Quality-Driven Information Filtering in the Context of Web-Based Information Systems. Dissertation, 2007. http://wifo5-03.informatik.uni-mannheim.de/bizer/pub/DisertationChrisBizer.pdf, Retrieved 07/03/2013.

[6] A. Freitas, T. Knap, S. O'Riain, and E. Curry. W3P: Building an OPM based provenance model for the Web. Future Generation Comp. Syst., 27(6):766-774, 2011, ISSN: 0167-739X.
 
Univerzita Karlova | Informační systém UK