Semantic annotation and querying RDF data
Název práce v češtině: | Sémantická anotace a dotazování nad RDF daty |
---|---|
Název v anglickém jazyce: | Semantic annotation and querying RDF data |
Klíčová slova: | sémantická anotace, dotazování nad RDF daty, uživatelské rozhraní, věrohodnost, tablo dotazy |
Klíčová slova anglicky: | semantic annotation, querying RDF data, user interface, trust, tableaux querying |
Akademický rok vypsání: | 2013/2014 |
Typ práce: | diplomová práce |
Jazyk práce: | angličtina |
Ústav: | Katedra softwarového inženýrství (32-KSI) |
Vedoucí / školitel: | prof. RNDr. Peter Vojtáš, DrSc. |
Řešitel: | skrytý - zadáno a potvrzeno stud. odd. |
Datum přihlášení: | 20.05.2013 |
Datum zadání: | 21.05.2013 |
Datum potvrzení stud. oddělením: | 18.11.2013 |
Datum a čas obhajoby: | 03.02.2015 10:00 |
Datum odevzdání elektronické podoby: | 10.12.2014 |
Datum odevzdání tištěné podoby: | 05.12.2014 |
Datum proběhlé obhajoby: | 03.02.2015 |
Oponenti: | doc. Mgr. Martin Nečaský, Ph.D. |
Zásady pro vypracování |
Cílem diplomové práce je navrhnout a naprogramovat prototyp serverového uživatelsky přívětivého rozhraní pro anotování webových stránek a dotazování nad těmito daty. Tyto anotace budou uloženy v naší databázi, která bude pracovat jako rozšíření veřejné databáze Freebase. Z tohoto důvodu budou naše anotace využívat stejný RDF formát jako databáze Freebase (případně jeho rozšíření). Anotace pro naši databázi budeme primárně získávat z počáteční lidské anotace a následně i z automatické anotace podobných stránek. Tento modul umožní také rozšíření slovníků a mapování metadat.
Řešitel dále navrhne webovou aplikaci, která bude schopna vyhledávat konkrétní druhy objektů a vypíše relevantní data, které získá z naší databáze a databáze Freebase. Samotný vzhled výpisu přitom bude záviset na druhu hledaného objektu. Tato aplikace bude dále sloužit na demonstraci korektnosti vyhledaných dat a korektnosti získaných dat z automatizované anotace. Součástí řešení je i sběr základního vzorku dat. Základní funkčnost bude ověřena na jedné více uniformní doméně a bude proveden "proof of concept" na jedné méně uniformní doméně. Teoretický základ je rozšíření modelu tablo dotazů o provazování metadat a následné zpracování vícero souhrnů. Toto zadání bude průběžně upravováno a usměrňováno podle potřeb úspěšnosti řešení. |
Seznam odborné literatury |
Dominik Fišer. Sémantická anotace doménově závislých dat. DP MFF UK 2011
Dušan Maruščák. Dolovanie a mapovanie ontológií s užívateľskou preferenciou. DP MFF UK 2007 Branislav Václav. Modely uživatelských preferencí v prostředí webovských obchodů. DP MFF UK 2010 https://developers.google.com/freebase/data http://www.w3.org/TR/turtle/ http://wiki.freebase.com/wiki/Main_Page další literatura o extrakci a anotaci informací z webu další literatura bude průběžně dodávaná a upřesňována |
Předběžná náplň práce |
Člověk při hledání informací, zajímavostí a jiných údajů o konkrétním objektu na webu musí procházet několik různých stránek, než najde požadované údaje (a a priori rozumí zobrazeným informacím). Cílem naší práce je eliminovat podobné ruční prohledávání různých stránek a místo toho vytvořit systém, který automaticky vyhledá všechny relevantní údaje o hledaném objektu přes několik kontextově různých stránek (a musíme systém naučit rozumět informacím). Je potřeba vzít v potaz také to, že některé domény jsou poměrně standardizovány vzhledem k zobrazovaným informacím a jiné domény jsou méně uniformní. |