PředmětyPředměty(verze: 806)
Předmět, akademický rok 2017/2018
   Přihlásit přes CAS
Sémantizace webu - NSWI108
Anglický název: Web Semantization
Zajišťuje: Katedra softwarového inženýrství (32-KSI)
Fakulta: Matematicko-fyzikální fakulta
Platnost: od 2016
Semestr: zimní
E-Kredity: 5
Rozsah, examinace: zimní s.:2/2 Z+Zk [hodiny/týden]
Počet míst: neomezen
Minimální obsazenost: neomezen
Stav předmětu: vyučován
Jazyk výuky: čeština, angličtina
Způsob výuky: prezenční
Další informace: http://www.ksi.mff.cuni.cz/~vojtas/vyuka/vyuka.html
Poznámka: povolen pro zápis po webu
Garant: prof. RNDr. Peter Vojtáš, DrSc.
Třída: Informatika Mgr. - Softwarové systémy
Kategorizace předmětu: Informatika > Informatika, Aplikační software, Počítačová grafika a geometrie, Databázové systémy, Didaktika informatiky, Diskrétní matematika, Předměty širšího základu, Předměty obecného základu, Počítačová a formální lingvistika, Optimalizace, Programování, Softwarové inženýrství, Teoretická informatika
Anotace -
Poslední úprava: RNDr. Michal Kopecký, Ph.D. (10.05.2017)

K plnému využití obsahu webu potřebujeme automatizovat zpracování jeho obsahu. Sémantizace je příslušné obohacování obsahu. Problematice se budeme věnovat hlavně z pohledu SW inženýrství: modelů, metodologií a procesů postupné sémantizace. V přednášce pokryjeme základní formální znalosti potřebné pro orientaci v oblasti a naučíme se některé praktické dovednosti. Na cvičeních se referuje o současných výsledcích z předních konferencí z oboru, učí pravidla pro sémantizaci a imituje virtuální projekt „Lean startup“ zaměřený na sémantizaci webu přes sociální síť.
Literatura -
Poslední úprava: RNDr. Michal Kopecký, Ph.D. (10.05.2017)

  • Pascal Hitzler, Markus Krötzsch, Sebastian Rudolph. Foundations of Semantic Web Technologies. Chapman & Hall/CRC 2010 , http://www.semantic-web-book.org/page/Slides
  • Eric Ries. Lean Startup, Crown Business 2011
  • David Harel, Dexter Kozen, Jerzy Tiuryn. Dynamic Logic. Publisher: The MIT Press 2000
  • G. James, D. Witten, T. Hastie, R. Tibshirani. An Introduction to Statistical Learning with Applications in R. Springer 2013C.
  • D. Manning, P. Raghavan, H. Schütze. An Introduction to Information Retrieval. Cambridge University Press 2009

Sylabus -
Poslední úprava: RNDr. Michal Kopecký, Ph.D. (10.05.2017)

Sémantizace webu
Základní problémy a vize automatizace zpracování obsahu webu, extrakce, anotace,

Metodologie Lean start-up a sémantizace

RDF-rámec, Deskripční logika, OWL
Datový model RDF a RDFS jako model metadata, formální sémantika, splňování

Základy deskripční logiky (DeL), znalosti a ontologie,

Webovské dotazovací jazyky
Jazyk SPARQL, SPARQL algebra

Dynamická logika
Výroková dynamická logika (DyL)

Rozhodnutelnost DyL

Dynamický model sémantizace webu
Integrace W3C modelů a Dynamické logiky

Spolehlivost automatické extrakce a anotace informací z webu

Kripkeovský model: stavy jsou predikátové se sémantikou založenou na dotazovacích jazycích, program (extraktory) zůstávají výrokové + informace o trénování extraktorů (metriky, data)

Hypotéza - Úspěšnost extrakce je podobná úspěšnosti na podobných zdrojích (např. tvořených stejnou šablonou)

 
Univerzita Karlova | Informační systém UK