Semantics Detection in Partially Structured Sources
Název práce v češtině: | Sémantická analýza částečně stukturovaných zdrojů |
---|---|
Název v anglickém jazyce: | Semantics Detection in Partially Structured Sources |
Akademický rok vypsání: | 2009/2010 |
Typ práce: | diplomová práce |
Jazyk práce: | angličtina |
Ústav: | Katedra softwarového inženýrství (32-KSI) |
Vedoucí / školitel: | RNDr. Filip Zavoral, Ph.D. |
Řešitel: | skrytý![]() |
Datum přihlášení: | 02.11.2009 |
Datum zadání: | 02.11.2009 |
Datum a čas obhajoby: | 06.09.2010 00:00 |
Datum odevzdání elektronické podoby: | 06.09.2010 |
Datum proběhlé obhajoby: | 06.09.2010 |
Oponenti: | Mgr. Jan Dědek, Ph.D. |
Zásady pro vypracování |
Cílem práce je vyvinout metody pro automatickou nebo poloautomatickou detekci nových a změnových dat z internetových zdrojů - e-mailových konferencí, diskusních fór apod.
Práce bude obsahovat tři hlavní části - analýzu možností detekce sémantiky, obecný návrh systému pro získávání strukturovaných dat a jeho pilotní implementaci se zaměřením na konkrétní doménu. Implementovaný systému by měl podporovat: - obecný mechanismus interpretace uživatelem zadaných extrakčních pravidel - automatizované zpracování dostupných dat nezávisle na fyzickém zdroji (e-mailové konference, webové stránky apod.) - synchronizaci dat dostupných z různých zdrojů - detekci změn a aktualizace extrahovaných dat - možnost datové integrace s dalšími relevantními projkety Součástí návrhu by měly být i možnosti automatického rozšíření a úprav extrakčních pravidel na základě skutečně zpracovávaných dat, případně další výstupy vhodné pro automatické zpracování dat. |
Seznam odborné literatury |
Markov, Larose: Data Mining the Web - Uncovering Patterns in Web Content, Structure, and Usage
Davies, Studer, Warren: Semantic Web Technologies - Trends and Research in Ontology-based Systems Cardoso, Hepp, Lytras: The Semantic Web: Real-World Applications from Industry |