Sémantická anotace doménově závislých dat
Název práce v češtině: | Sémantická anotace doménově závislých dat |
---|---|
Název v anglickém jazyce: | Semantic annotation of domain dependent data |
Klíčová slova: | sémantický web, sémantická anotace, manuální anotace webových stránek, rozšíření prohlíţeče Google Chrome pro sémantickou anotaci |
Klíčová slova anglicky: | semantic web, semantic annotation, manual web pages annotation, Google Chrome extension for semantic annotation |
Akademický rok vypsání: | 2010/2011 |
Typ práce: | diplomová práce |
Jazyk práce: | čeština |
Ústav: | Katedra softwarového inženýrství (32-KSI) |
Vedoucí / školitel: | prof. RNDr. Peter Vojtáš, DrSc. |
Řešitel: | skrytý - zadáno a potvrzeno stud. odd. |
Datum přihlášení: | 03.06.2010 |
Datum zadání: | 30.09.2010 |
Datum a čas obhajoby: | 05.09.2011 09:30 |
Datum odevzdání elektronické podoby: | 19.07.2011 |
Datum odevzdání tištěné podoby: | 05.08.2011 |
Datum proběhlé obhajoby: | 05.09.2011 |
Oponenti: | RNDr. Michal Kopecký, Ph.D. |
Zásady pro vypracování |
Cílem diplomové práce je navrhnout uživatelsky přívětivé rozhraní a možné přístupy ke zjednodušení anotace webových stránek z vybrané domény obyčejnými uživateli. Je snahou uživateli co nejvíce zjednodušit anotaci webových stránek a to na základě již dříve anotovaných webových stránek z dané domény nebo pomocí metod automatické anotace. Uživatel může nabízených strojových metod využít nebo nemusí. Výsledek anotace ale záleží především na rozhodnutí uživatele.
Řešitel nejprve vypracuje modelové příklady hledání reálných uživatelů v doménově závislých datech na webu, aby zjistil požadavky uživatelů. Poté zmapuje možné přístupy k anotaci strukturovaných i nestrukturovaných dat s využitím doménové znalosti. Lze již předpokládat existenci nějaké doménově nezávislé anotace. Na základě zjištěných poznatků řešitel navrhne přístupy pro zjednodušení anotace webových stránek. V rámci práce bude třeba navrhnout způsob získávání dat od uživatele, uživatelsky přívětivý způsob práce s ontologií i možnosti učení anotačního nástroje od uživatele. Primárním zdrojem doménové znalosti bude uživatel a jím anotované webové stránky, ze kterých se anotační nástroj zkusí doménovou znalost naučit a nabízet dalším uživatelům. V praktické části práce zkusí řešitel navrhnout uživatelsky přívětivé rozhraní, které obyčejnému uživateli umožní jednoduše anotovat webové stránky z vybrané domény na ontologii. Anotační nástroj se bude snažit s využitím navržených metod uživateli co nejvíce zjednodušit anotaci webových stránek, a to na základě podobných anotovaných webových stránek posbíraných od dalších uživatelů. |
Seznam odborné literatury |
http://www.w3.org/2001/sw/wiki/Main_Page
http://semanticweb.org/wiki/Category:Semantic_annotation_tool dalsi nastroje pro extrakci/anotaci: Lixto Visual Developer (http://www.lixto.com) Flersa (http://www.scms.es/joomla/ -> demo) TopBraid Suite -> The Basic RDFa Editor (http://www.topquadrant.com/w3c/RDFa/) Ontology Annotation Tool (OAT) - GATE plugin (http://gate.ac.uk/sale/tao/splitch14.html#sec:ontologies:ocat) From Manual to Semi-automatic Semantic Annotation: About Ontology-based Text Annotation Tools (2000) M. Erdmann, A. Maedche, H.-P. Schnurr, S. Staab (http://citeseer.ist.psu.edu/erdmann00from.html) Vidome D. Maruscaka: Eckhardt, A., Horvath, T., Maruscak, D., Novotny, R., Vojtas, P.: Uncertainty Issues and Algorithms in Automating Process Connecting Web and User, Lecture Notes in Computer Science, vol. 5327. Springer Verlag (2008) Extrakce JD: Dedek, J., Vojtas, P.: Linguistic extraction for semantic annotation. In: Badica, C., Mangioni, G., Carchiolo, V., Burdescu, D. (Eds.), IDC Vol. 162 of Studies in Computational Intelligence. Springer-Verlag, 85--94. URL http://www.springerlink.com/content/w7213j007t416132/ |
Předběžná náplň práce |
Vyhledávání na webu pomocí klíčových slov je pro uživatele často nedostačující, proto chceme uživateli nabídnout jiný přístup k vyhledávání podle významu. Základním předpokladem sémantického vyhledávání na webu je znalost významu a vztahů mezi informacemi, kterou můžeme získat mimo jiné anotací webu uživatelem. Naším cílem je zpřístupnit uživateli srozumitelnou formou možnost anotace webové stránky. Na základě takto získaných dat, se potom můžeme učit a zjednodušit anotaci dalších podobných stránek. |