Thesis (Selection of subject)Thesis (Selection of subject)(version: 368)
Thesis details
   Login via CAS
Sémantická anotace doménově závislých dat
Thesis title in Czech: Sémantická anotace doménově závislých dat
Thesis title in English: Semantic annotation of domain dependent data
Key words: sémantický web, sémantická anotace, manuální anotace webových stránek, rozšíření prohlíţeče Google Chrome pro sémantickou anotaci
English key words: semantic web, semantic annotation, manual web pages annotation, Google Chrome extension for semantic annotation
Academic year of topic announcement: 2010/2011
Thesis type: diploma thesis
Thesis language: čeština
Department: Department of Software Engineering (32-KSI)
Supervisor: prof. RNDr. Peter Vojtáš, DrSc.
Author: hidden - assigned and confirmed by the Study Dept.
Date of registration: 03.06.2010
Date of assignment: 30.09.2010
Date and time of defence: 05.09.2011 09:30
Date of electronic submission:19.07.2011
Date of submission of printed version:05.08.2011
Date of proceeded defence: 05.09.2011
Opponents: RNDr. Michal Kopecký, Ph.D.
 
 
 
Guidelines
Cílem diplomové práce je navrhnout uživatelsky přívětivé rozhraní a možné přístupy ke zjednodušení anotace webových stránek z vybrané domény obyčejnými uživateli. Je snahou uživateli co nejvíce zjednodušit anotaci webových stránek a to na základě již dříve anotovaných webových stránek z dané domény nebo pomocí metod automatické anotace. Uživatel může nabízených strojových metod využít nebo nemusí. Výsledek anotace ale záleží především na rozhodnutí uživatele.
Řešitel nejprve vypracuje modelové příklady hledání reálných uživatelů v doménově závislých datech na webu, aby zjistil požadavky uživatelů. Poté zmapuje možné přístupy k anotaci strukturovaných i nestrukturovaných dat s využitím doménové znalosti. Lze již předpokládat existenci nějaké doménově nezávislé anotace. Na základě zjištěných poznatků řešitel navrhne přístupy pro zjednodušení anotace webových stránek. V rámci práce bude třeba navrhnout způsob získávání dat od uživatele, uživatelsky přívětivý způsob práce s ontologií i možnosti učení anotačního nástroje od uživatele. Primárním zdrojem doménové znalosti bude uživatel a jím anotované webové stránky, ze kterých se anotační nástroj zkusí doménovou znalost naučit a nabízet dalším uživatelům.
V praktické části práce zkusí řešitel navrhnout uživatelsky přívětivé rozhraní, které obyčejnému uživateli umožní jednoduše anotovat webové stránky z vybrané domény na ontologii. Anotační nástroj se bude snažit s využitím navržených metod uživateli co nejvíce zjednodušit anotaci webových stránek, a to na základě podobných anotovaných webových stránek posbíraných od dalších uživatelů.
References
http://www.w3.org/2001/sw/wiki/Main_Page
http://semanticweb.org/wiki/Category:Semantic_annotation_tool
dalsi nastroje pro extrakci/anotaci:
Lixto Visual Developer (http://www.lixto.com)
Flersa (http://www.scms.es/joomla/ -> demo)
TopBraid Suite -> The Basic RDFa Editor (http://www.topquadrant.com/w3c/RDFa/)
Ontology Annotation Tool (OAT) - GATE plugin (http://gate.ac.uk/sale/tao/splitch14.html#sec:ontologies:ocat)
From Manual to Semi-automatic Semantic Annotation: About Ontology-based Text Annotation Tools (2000) M. Erdmann, A. Maedche,
H.-P. Schnurr, S. Staab (http://citeseer.ist.psu.edu/erdmann00from.html)
Vidome D. Maruscaka: Eckhardt, A., Horvath, T., Maruscak, D., Novotny, R., Vojtas, P.: Uncertainty Issues and Algorithms in Automating Process Connecting Web and User, Lecture Notes in Computer Science, vol. 5327. Springer Verlag (2008)
Extrakce JD: Dedek, J., Vojtas, P.: Linguistic extraction for semantic annotation. In: Badica, C., Mangioni, G., Carchiolo, V., Burdescu, D. (Eds.), IDC Vol. 162 of Studies in Computational Intelligence. Springer-Verlag, 85--94. URL http://www.springerlink.com/content/w7213j007t416132/

Preliminary scope of work
Vyhledávání na webu pomocí klíčových slov je pro uživatele často nedostačující, proto chceme uživateli nabídnout jiný přístup k vyhledávání podle významu. Základním předpokladem sémantického vyhledávání na webu je znalost významu a vztahů mezi informacemi, kterou můžeme získat mimo jiné anotací webu uživatelem. Naším cílem je zpřístupnit uživateli srozumitelnou formou možnost anotace webové stránky. Na základě takto získaných dat, se potom můžeme učit a zjednodušit anotaci dalších podobných stránek.
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html