PředmětyPředměty(verze: 849)
Předmět, akademický rok 2019/2020
   Přihlásit přes CAS
Sémantizace webu - NSWI108
Anglický název: Web Semantization
Zajišťuje: Katedra softwarového inženýrství (32-KSI)
Fakulta: Matematicko-fyzikální fakulta
Platnost: od 2019 do 2019
Semestr: zimní
E-Kredity: 5
Rozsah, examinace: zimní s.:2/2 Z+Zk [hodiny/týden]
Počet míst: neomezen
Minimální obsazenost: neomezen
Stav předmětu: nevyučován
Jazyk výuky: čeština, angličtina
Způsob výuky: prezenční
Další informace: http://www.ksi.mff.cuni.cz/~vojtas/vyuka/vyuka.html
Poznámka: povolen pro zápis po webu
Garant: prof. RNDr. Peter Vojtáš, DrSc.
Třída: Informatika Mgr. - Softwarové systémy
Kategorizace předmětu: Informatika > Informatika, Aplikační software, Počítačová grafika a geometrie, Databázové systémy, Didaktika informatiky, Diskrétní matematika, Předměty širšího základu, Předměty obecného základu, Počítačová a formální lingvistika, Optimalizace, Programování, Softwarové inženýrství, Teoretická informatika
Anotace -
Poslední úprava: RNDr. Michal Kopecký, Ph.D. (09.05.2019)
Základní modely sémantického webu jsou pokryty v NSWI145 , dynamické aspekty extrakce dat z webu (sémantizace) jsou pojednány v NDBI021 a NSWI167 (též NSWI144 a NSWI142). Sémantizace je příslušné obohacování obsahu pro automatizaci jeho zpracování. Problematice se budeme věnovat hlavně z pohledu SW inženýrství: modelů, metodologií a procesů postupné sémantizace. Pokryjeme základní formální znalosti potřebné pro orientaci v oblasti a naučíme se některé praktické dovednosti. Na cvičeních se referuje o současných výsledcích z předních konferencí z oboru, učí pravidla pro sémantizaci.
Podmínky zakončení předmětu -
Poslední úprava: prof. RNDr. Peter Vojtáš, DrSc. (12.10.2017)

Terms of passing the course consist of reporting on current achievements, induction on semantized data, project of a virtual Lean Startup and customer imitation via a social network. These are only conditions for getting credits. Exam is oral and requires basic understanding of whole material.

As soon as terminology is introduced, detailed milestones (also form of deliverables) and preferred deadlines will be announced (with possible repeated attempts). There is no evidence on personal presence. Nevertheless, no additional explanation for tasks will be given, except on the respective lab and brief description on the course web. Final deadline is end of semester (without repeated attempts).

Literatura -
Poslední úprava: RNDr. Michal Kopecký, Ph.D. (10.05.2017)
  • Pascal Hitzler, Markus Krötzsch, Sebastian Rudolph. Foundations of Semantic Web Technologies. Chapman & Hall/CRC 2010 , http://www.semantic-web-book.org/page/Slides
  • Eric Ries. Lean Startup, Crown Business 2011
  • David Harel, Dexter Kozen, Jerzy Tiuryn. Dynamic Logic. Publisher: The MIT Press 2000
  • G. James, D. Witten, T. Hastie, R. Tibshirani. An Introduction to Statistical Learning with Applications in R. Springer 2013C.
  • D. Manning, P. Raghavan, H. Schütze. An Introduction to Information Retrieval. Cambridge University Press 2009

Sylabus -
Poslední úprava: RNDr. Michal Kopecký, Ph.D. (10.05.2017)
Sémantizace webu
Základní problémy a vize automatizace zpracování obsahu webu, extrakce, anotace,

Metodologie Lean start-up a sémantizace

RDF-rámec, Deskripční logika, OWL
Datový model RDF a RDFS jako model metadata, formální sémantika, splňování

Základy deskripční logiky (DeL), znalosti a ontologie,

Webovské dotazovací jazyky
Jazyk SPARQL, SPARQL algebra

Dynamická logika
Výroková dynamická logika (DyL)

Rozhodnutelnost DyL

Dynamický model sémantizace webu
Integrace W3C modelů a Dynamické logiky

Spolehlivost automatické extrakce a anotace informací z webu

Kripkeovský model: stavy jsou predikátové se sémantikou založenou na dotazovacích jazycích, program (extraktory) zůstávají výrokové + informace o trénování extraktorů (metriky, data)

Hypotéza - Úspěšnost extrakce je podobná úspěšnosti na podobných zdrojích (např. tvořených stejnou šablonou)

 
Univerzita Karlova | Informační systém UK