Témata prací (Výběr práce)

Váš prohlížeč nepodporuje JavaScript nebo je jeho podpora vypnutá. Některé funkce nemusejí být dostupné.

Semantic annotation and querying RDF data

Název práce v češtině:	Sémantická anotace a dotazování nad RDF daty
Název v anglickém jazyce:	Semantic annotation and querying RDF data
Klíčová slova:	sémantická anotace, dotazování nad RDF daty, uživatelské rozhraní, věrohodnost, tablo dotazy
Klíčová slova anglicky:	semantic annotation, querying RDF data, user interface, trust, tableaux querying
Akademický rok vypsání:	2013/2014
Typ práce:	diplomová práce
Jazyk práce:	angličtina
Ústav:	Katedra softwarového inženýrství (32-KSI)
Vedoucí / školitel:	prof. RNDr. Peter Vojtáš, DrSc.
Řešitel:	skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení:	20.05.2013
Datum zadání:	21.05.2013
Datum potvrzení stud. oddělením:	18.11.2013
Datum a čas obhajoby:	03.02.2015 10:00
Datum odevzdání elektronické podoby:	10.12.2014
Datum odevzdání tištěné podoby:	05.12.2014
Datum proběhlé obhajoby:	03.02.2015
Oponenti:	doc. Mgr. Martin Nečaský, Ph.D.

Zásady pro vypracování

Cílem diplomové práce je navrhnout a naprogramovat prototyp serverového uživatelsky přívětivého rozhraní pro anotování webových stránek a dotazování nad těmito daty. Tyto anotace budou uloženy v naší databázi, která bude pracovat jako rozšíření veřejné databáze Freebase. Z tohoto důvodu budou naše anotace využívat stejný RDF formát jako databáze Freebase (případně jeho rozšíření). Anotace pro naši databázi budeme primárně získávat z počáteční lidské anotace a následně i z automatické anotace podobných stránek. Tento modul umožní také rozšíření slovníků a mapování metadat.
Řešitel dále navrhne webovou aplikaci, která bude schopna vyhledávat konkrétní druhy objektů a vypíše relevantní data, které získá z naší databáze a databáze Freebase. Samotný vzhled výpisu přitom bude záviset na druhu hledaného objektu. Tato aplikace bude dále sloužit na demonstraci korektnosti vyhledaných dat a korektnosti získaných dat z automatizované anotace.
Součástí řešení je i sběr základního vzorku dat. Základní funkčnost bude ověřena na jedné více uniformní doméně a bude proveden "proof of concept" na jedné méně uniformní doméně.
Teoretický základ je rozšíření modelu tablo dotazů o provazování metadat a následné zpracování vícero souhrnů.
Toto zadání bude průběžně upravováno a usměrňováno podle potřeb úspěšnosti řešení.

Seznam odborné literatury

Dominik Fišer. Sémantická anotace doménově závislých dat. DP MFF UK 2011
Dušan Maruščák. Dolovanie a mapovanie ontológií s užívateľskou preferenciou. DP MFF UK 2007
Branislav Václav. Modely uživatelských preferencí v prostředí webovských obchodů. DP MFF UK 2010
https://developers.google.com/freebase/data
http://www.w3.org/TR/turtle/
http://wiki.freebase.com/wiki/Main_Page
další literatura o extrakci a anotaci informací z webu
další literatura bude průběžně dodávaná a upřesňována

Předběžná náplň práce

Člověk při hledání informací, zajímavostí a jiných údajů o konkrétním objektu na webu musí procházet několik různých stránek, než najde požadované údaje (a a priori rozumí zobrazeným informacím). Cílem naší práce je eliminovat podobné ruční prohledávání různých stránek a místo toho vytvořit systém, který automaticky vyhledá všechny relevantní údaje o hledaném objektu přes několik kontextově různých stránek (a musíme systém naučit rozumět informacím). Je potřeba vzít v potaz také to, že některé domény jsou poměrně standardizovány vzhledem k zobrazovaným informacím a jiné domény jsou méně uniformní.