PředmětyPředměty(verze: 945)
Předmět, akademický rok 2023/2024
   Přihlásit přes CAS
Vyhledávání v multimediálních databázích - NDBI030
Anglický název: Multimedia Database Searching
Zajišťuje: Katedra softwarového inženýrství (32-KSI)
Fakulta: Matematicko-fyzikální fakulta
Platnost: od 2010
Semestr: letní
E-Kredity: 6
Rozsah, examinace: letní s.:2/2, Z+Zk [HT]
Počet míst: neomezen
Minimální obsazenost: neomezen
4EU+: ne
Virtuální mobilita / počet míst pro virtuální mobilitu: ne
Stav předmětu: zrušen
Jazyk výuky: čeština
Způsob výuky: prezenční
Způsob výuky: prezenční
Garant: prof. RNDr. Tomáš Skopal, Ph.D.
Třída: Informatika Mgr. - volitelný
Kategorizace předmětu: Informatika > Databázové systémy
Prerekvizity : NDBI007, NDBI025
Výsledky anket   Termíny zkoušek   Rozvrh   Nástěnka   
Anotace -
Poslední úprava: T_KSI (28.04.2005)
Předmět seznamuje s problematikou vyhledávání v multimediálních databázích (MDB), obecně v kolekcích nestrukturovaných dat. Na rozdíl od klasických (relačních) systémů a dotazů na shodu je podstatou vyhledávání v MDB extrakce vlastností z multimediálních dokumentů a dotazování na podobnost. Druhá část kurzu je zaměřena na indexování multimediálních dat za účelem efektivního vyhledávání.
Literatura
Poslední úprava: prof. RNDr. Tomáš Skopal, Ph.D. (18.04.2006)

Similarity Search - The Metric Space Approach, P. Zezula, G. Amato, V. Dohnal, M. Batko, Springer, 2006

Image Databases, V. Castelli, L.D. Bergman (eds.), Wiley, 2002

Metric Indexing in Information Retrieval, T. Skopal, Ph.D. thesis, TU Ostrava, 2004 (k dispozici na webu přednášejícího)

Multimedia Systems and Content-based Management, S. Deb, Idea Group Publishing, 2004

Image Retrieval, C. Jorgensen, Scarecrow Press, 2003

+ internetové zdroje a odkazy na webu přednášejícího

Sylabus -
Poslední úprava: prof. RNDr. Tomáš Skopal, Ph.D. (20.07.2005)

1. Úvod: Multimediální databáze (MDB). Motivace k vyhledávání v MDB, aplikace. Modality vyhledávání a dotazování. Text-based vs. content-based retrieval. Extrakce vlastností a míry podobnosti. Indexování.

2. Formalizace MDB, sémantika dotazování, podobnost jako relevance k dotazu. Kvalita výsledku (effectiveness) a rychlost vyhledávání (efficiency) + míry.

3. Extrakce vlastností z multimediálních dokumentů a míry podobnosti. Vektorové reprezentace, řetězce/sekvence, množiny, grafy. Vlastnosti měr, metrické axiomy. Diskuse k mírám a příslušným teoriím podobnosti.

4. Dotazy - rozsahový dotaz, k nejbližších sousedů, reverse nearest neighbor, closest pair, similarity join.

5. Modality vyhledávání. Dotazování, relevance feedback, browsing, navigace ve výsledku dotazu, klasifikace. Aplikační rozhraní. Ukázky existujících aplikací.

6. Aplikace: podobnostní vyhledávání obrázků podle barev, textur, tvarů. Otisky prstů, oční duhovky, melodie, bílkoviny, text, XML.

7. Mapování do vektorů a redukce dimenze. Aproximace vs. filtrace. Skrytá sémantika jako součást extrakce vlastností. Lineární projekce: LSI, náhodné projekce, FastMap, SparseMap, MetricMap. Nelineární projekce.

8. Metrické přístupové metody (metric access methods) vs. prostorové přístupové metody (spatial access methods). Prokletí dimenzionality. Distribuce vzdáleností a vnitřní dimenze.

9. Statické MAM: (m)vp-strom, gh-strom, GNAT

10. Dynamické MAM: M-strom + modifikace (Slim-strom, PM-strom, SPM-strom)

11. Pivot-based metody. Globální a lokální pivoty. M-strom vs. LAESA. vp-forest, D-index. Techniky výběru globálních pivotů.

12. Aproximativní a probabilistické metody vyhledávání. AC a PAC dotazování. Nemetrické vyhledávání.

 
Univerzita Karlova | Informační systém UK