Sémantická anotace doménově závislých dat
Thesis title in Czech: | Sémantická anotace doménově závislých dat |
---|---|
Thesis title in English: | Semantic annotation of domain dependent data |
Key words: | sémantický web, sémantická anotace, manuální anotace webových stránek, rozšíření prohlíţeče Google Chrome pro sémantickou anotaci |
English key words: | semantic web, semantic annotation, manual web pages annotation, Google Chrome extension for semantic annotation |
Academic year of topic announcement: | 2010/2011 |
Thesis type: | diploma thesis |
Thesis language: | čeština |
Department: | Department of Software Engineering (32-KSI) |
Supervisor: | prof. RNDr. Peter Vojtáš, DrSc. |
Author: | hidden - assigned and confirmed by the Study Dept. |
Date of registration: | 03.06.2010 |
Date of assignment: | 30.09.2010 |
Date and time of defence: | 05.09.2011 09:30 |
Date of electronic submission: | 19.07.2011 |
Date of submission of printed version: | 05.08.2011 |
Date of proceeded defence: | 05.09.2011 |
Opponents: | RNDr. Michal Kopecký, Ph.D. |
Guidelines |
Cílem diplomové práce je navrhnout uživatelsky přívětivé rozhraní a možné přístupy ke zjednodušení anotace webových stránek z vybrané domény obyčejnými uživateli. Je snahou uživateli co nejvíce zjednodušit anotaci webových stránek a to na základě již dříve anotovaných webových stránek z dané domény nebo pomocí metod automatické anotace. Uživatel může nabízených strojových metod využít nebo nemusí. Výsledek anotace ale záleží především na rozhodnutí uživatele.
Řešitel nejprve vypracuje modelové příklady hledání reálných uživatelů v doménově závislých datech na webu, aby zjistil požadavky uživatelů. Poté zmapuje možné přístupy k anotaci strukturovaných i nestrukturovaných dat s využitím doménové znalosti. Lze již předpokládat existenci nějaké doménově nezávislé anotace. Na základě zjištěných poznatků řešitel navrhne přístupy pro zjednodušení anotace webových stránek. V rámci práce bude třeba navrhnout způsob získávání dat od uživatele, uživatelsky přívětivý způsob práce s ontologií i možnosti učení anotačního nástroje od uživatele. Primárním zdrojem doménové znalosti bude uživatel a jím anotované webové stránky, ze kterých se anotační nástroj zkusí doménovou znalost naučit a nabízet dalším uživatelům. V praktické části práce zkusí řešitel navrhnout uživatelsky přívětivé rozhraní, které obyčejnému uživateli umožní jednoduše anotovat webové stránky z vybrané domény na ontologii. Anotační nástroj se bude snažit s využitím navržených metod uživateli co nejvíce zjednodušit anotaci webových stránek, a to na základě podobných anotovaných webových stránek posbíraných od dalších uživatelů. |
References |
http://www.w3.org/2001/sw/wiki/Main_Page
http://semanticweb.org/wiki/Category:Semantic_annotation_tool dalsi nastroje pro extrakci/anotaci: Lixto Visual Developer (http://www.lixto.com) Flersa (http://www.scms.es/joomla/ -> demo) TopBraid Suite -> The Basic RDFa Editor (http://www.topquadrant.com/w3c/RDFa/) Ontology Annotation Tool (OAT) - GATE plugin (http://gate.ac.uk/sale/tao/splitch14.html#sec:ontologies:ocat) From Manual to Semi-automatic Semantic Annotation: About Ontology-based Text Annotation Tools (2000) M. Erdmann, A. Maedche, H.-P. Schnurr, S. Staab (http://citeseer.ist.psu.edu/erdmann00from.html) Vidome D. Maruscaka: Eckhardt, A., Horvath, T., Maruscak, D., Novotny, R., Vojtas, P.: Uncertainty Issues and Algorithms in Automating Process Connecting Web and User, Lecture Notes in Computer Science, vol. 5327. Springer Verlag (2008) Extrakce JD: Dedek, J., Vojtas, P.: Linguistic extraction for semantic annotation. In: Badica, C., Mangioni, G., Carchiolo, V., Burdescu, D. (Eds.), IDC Vol. 162 of Studies in Computational Intelligence. Springer-Verlag, 85--94. URL http://www.springerlink.com/content/w7213j007t416132/ |
Preliminary scope of work |
Vyhledávání na webu pomocí klíčových slov je pro uživatele často nedostačující, proto chceme uživateli nabídnout jiný přístup k vyhledávání podle významu. Základním předpokladem sémantického vyhledávání na webu je znalost významu a vztahů mezi informacemi, kterou můžeme získat mimo jiné anotací webu uživatelem. Naším cílem je zpřístupnit uživateli srozumitelnou formou možnost anotace webové stránky. Na základě takto získaných dat, se potom můžeme učit a zjednodušit anotaci dalších podobných stránek. |