Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Semantic annotation and querying RDF data
Název práce v češtině: Sémantická anotace a dotazování nad RDF daty
Název v anglickém jazyce: Semantic annotation and querying RDF data
Klíčová slova: sémantická anotace, dotazování nad RDF daty, uživatelské rozhraní, věrohodnost, tablo dotazy
Klíčová slova anglicky: semantic annotation, querying RDF data, user interface, trust, tableaux querying
Akademický rok vypsání: 2013/2014
Typ práce: diplomová práce
Jazyk práce: angličtina
Ústav: Katedra softwarového inženýrství (32-KSI)
Vedoucí / školitel: prof. RNDr. Peter Vojtáš, DrSc.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 20.05.2013
Datum zadání: 21.05.2013
Datum potvrzení stud. oddělením: 18.11.2013
Datum a čas obhajoby: 03.02.2015 10:00
Datum odevzdání elektronické podoby:10.12.2014
Datum odevzdání tištěné podoby:05.12.2014
Datum proběhlé obhajoby: 03.02.2015
Oponenti: doc. Mgr. Martin Nečaský, Ph.D.
 
 
 
Zásady pro vypracování
Cílem diplomové práce je navrhnout a naprogramovat prototyp serverového uživatelsky přívětivého rozhraní pro anotování webových stránek a dotazování nad těmito daty. Tyto anotace budou uloženy v naší databázi, která bude pracovat jako rozšíření veřejné databáze Freebase. Z tohoto důvodu budou naše anotace využívat stejný RDF formát jako databáze Freebase (případně jeho rozšíření). Anotace pro naši databázi budeme primárně získávat z počáteční lidské anotace a následně i z automatické anotace podobných stránek. Tento modul umožní také rozšíření slovníků a mapování metadat.
Řešitel dále navrhne webovou aplikaci, která bude schopna vyhledávat konkrétní druhy objektů a vypíše relevantní data, které získá z naší databáze a databáze Freebase. Samotný vzhled výpisu přitom bude záviset na druhu hledaného objektu. Tato aplikace bude dále sloužit na demonstraci korektnosti vyhledaných dat a korektnosti získaných dat z automatizované anotace.
Součástí řešení je i sběr základního vzorku dat. Základní funkčnost bude ověřena na jedné více uniformní doméně a bude proveden "proof of concept" na jedné méně uniformní doméně.
Teoretický základ je rozšíření modelu tablo dotazů o provazování metadat a následné zpracování vícero souhrnů.
Toto zadání bude průběžně upravováno a usměrňováno podle potřeb úspěšnosti řešení.
Seznam odborné literatury
Dominik Fišer. Sémantická anotace doménově závislých dat. DP MFF UK 2011
Dušan Maruščák. Dolovanie a mapovanie ontológií s užívateľskou preferenciou. DP MFF UK 2007
Branislav Václav. Modely uživatelských preferencí v prostředí webovských obchodů. DP MFF UK 2010
https://developers.google.com/freebase/data
http://www.w3.org/TR/turtle/
http://wiki.freebase.com/wiki/Main_Page
další literatura o extrakci a anotaci informací z webu
další literatura bude průběžně dodávaná a upřesňována
Předběžná náplň práce
Člověk při hledání informací, zajímavostí a jiných údajů o konkrétním objektu na webu musí procházet několik různých stránek, než najde požadované údaje (a a priori rozumí zobrazeným informacím). Cílem naší práce je eliminovat podobné ruční prohledávání různých stránek a místo toho vytvořit systém, který automaticky vyhledá všechny relevantní údaje o hledaném objektu přes několik kontextově různých stránek (a musíme systém naučit rozumět informacím). Je potřeba vzít v potaz také to, že některé domény jsou poměrně standardizovány vzhledem k zobrazovaným informacím a jiné domény jsou méně uniformní.
 
Univerzita Karlova | Informační systém UK