Thesis (Selection of subject)Thesis (Selection of subject)(version: 368)
Thesis details
   Login via CAS
Semantic annotation and querying RDF data
Thesis title in Czech: Sémantická anotace a dotazování nad RDF daty
Thesis title in English: Semantic annotation and querying RDF data
Key words: sémantická anotace, dotazování nad RDF daty, uživatelské rozhraní, věrohodnost, tablo dotazy
English key words: semantic annotation, querying RDF data, user interface, trust, tableaux querying
Academic year of topic announcement: 2013/2014
Thesis type: diploma thesis
Thesis language: angličtina
Department: Department of Software Engineering (32-KSI)
Supervisor: prof. RNDr. Peter Vojtáš, DrSc.
Author: hidden - assigned and confirmed by the Study Dept.
Date of registration: 20.05.2013
Date of assignment: 21.05.2013
Confirmed by Study dept. on: 18.11.2013
Date and time of defence: 03.02.2015 10:00
Date of electronic submission:10.12.2014
Date of submission of printed version:05.12.2014
Date of proceeded defence: 03.02.2015
Opponents: doc. Mgr. Martin Nečaský, Ph.D.
 
 
 
Guidelines
Cílem diplomové práce je navrhnout a naprogramovat prototyp serverového uživatelsky přívětivého rozhraní pro anotování webových stránek a dotazování nad těmito daty. Tyto anotace budou uloženy v naší databázi, která bude pracovat jako rozšíření veřejné databáze Freebase. Z tohoto důvodu budou naše anotace využívat stejný RDF formát jako databáze Freebase (případně jeho rozšíření). Anotace pro naši databázi budeme primárně získávat z počáteční lidské anotace a následně i z automatické anotace podobných stránek. Tento modul umožní také rozšíření slovníků a mapování metadat.
Řešitel dále navrhne webovou aplikaci, která bude schopna vyhledávat konkrétní druhy objektů a vypíše relevantní data, které získá z naší databáze a databáze Freebase. Samotný vzhled výpisu přitom bude záviset na druhu hledaného objektu. Tato aplikace bude dále sloužit na demonstraci korektnosti vyhledaných dat a korektnosti získaných dat z automatizované anotace.
Součástí řešení je i sběr základního vzorku dat. Základní funkčnost bude ověřena na jedné více uniformní doméně a bude proveden "proof of concept" na jedné méně uniformní doméně.
Teoretický základ je rozšíření modelu tablo dotazů o provazování metadat a následné zpracování vícero souhrnů.
Toto zadání bude průběžně upravováno a usměrňováno podle potřeb úspěšnosti řešení.
References
Dominik Fišer. Sémantická anotace doménově závislých dat. DP MFF UK 2011
Dušan Maruščák. Dolovanie a mapovanie ontológií s užívateľskou preferenciou. DP MFF UK 2007
Branislav Václav. Modely uživatelských preferencí v prostředí webovských obchodů. DP MFF UK 2010
https://developers.google.com/freebase/data
http://www.w3.org/TR/turtle/
http://wiki.freebase.com/wiki/Main_Page
další literatura o extrakci a anotaci informací z webu
další literatura bude průběžně dodávaná a upřesňována
Preliminary scope of work
Člověk při hledání informací, zajímavostí a jiných údajů o konkrétním objektu na webu musí procházet několik různých stránek, než najde požadované údaje (a a priori rozumí zobrazeným informacím). Cílem naší práce je eliminovat podobné ruční prohledávání různých stránek a místo toho vytvořit systém, který automaticky vyhledá všechny relevantní údaje o hledaném objektu přes několik kontextově různých stránek (a musíme systém naučit rozumět informacím). Je potřeba vzít v potaz také to, že některé domény jsou poměrně standardizovány vzhledem k zobrazovaným informacím a jiné domény jsou méně uniformní.
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html