|
|
|
||
|
Předmět seznamuje s problematikou vyhledávání v multimediálních databázích (MDB), obecně v kolekcích nestrukturovaných dat. Na rozdíl od klasických (relačních) systémů a dotazů na shodu je podstatou vyhledávání v MDB extrakce vlastností z multimediálních dokumentů a dotazování na podobnost. Druhá část kurzu je zaměřena na indexování multimediálních dat za účelem efektivního vyhledávání.
Poslední úprava: T_KSI (28.04.2005)
|
|
||
|
Similarity Search - The Metric Space Approach, P. Zezula, G. Amato, V. Dohnal, M. Batko, Springer, 2006 Image Databases, V. Castelli, L.D. Bergman (eds.), Wiley, 2002 Metric Indexing in Information Retrieval, T. Skopal, Ph.D. thesis, TU Ostrava, 2004 (k dispozici na webu přednášejícího) Multimedia Systems and Content-based Management, S. Deb, Idea Group Publishing, 2004 Image Retrieval, C. Jorgensen, Scarecrow Press, 2003 + internetové zdroje a odkazy na webu přednášejícího Poslední úprava: Skopal Tomáš, prof. RNDr., Ph.D. (18.04.2006)
|
|
||
|
1. Úvod: Multimediální databáze (MDB). Motivace k vyhledávání v MDB, aplikace. Modality vyhledávání a dotazování. Text-based vs. content-based retrieval. Extrakce vlastností a míry podobnosti. Indexování.
2. Formalizace MDB, sémantika dotazování, podobnost jako relevance k dotazu. Kvalita výsledku (effectiveness) a rychlost vyhledávání (efficiency) + míry.
3. Extrakce vlastností z multimediálních dokumentů a míry podobnosti. Vektorové reprezentace, řetězce/sekvence, množiny, grafy. Vlastnosti měr, metrické axiomy. Diskuse k mírám a příslušným teoriím podobnosti.
4. Dotazy - rozsahový dotaz, k nejbližších sousedů, reverse nearest neighbor, closest pair, similarity join.
5. Modality vyhledávání. Dotazování, relevance feedback, browsing, navigace ve výsledku dotazu, klasifikace. Aplikační rozhraní. Ukázky existujících aplikací.
6. Aplikace: podobnostní vyhledávání obrázků podle barev, textur, tvarů. Otisky prstů, oční duhovky, melodie, bílkoviny, text, XML.
7. Mapování do vektorů a redukce dimenze. Aproximace vs. filtrace. Skrytá sémantika jako součást extrakce vlastností. Lineární projekce: LSI, náhodné projekce, FastMap, SparseMap, MetricMap. Nelineární projekce.
8. Metrické přístupové metody (metric access methods) vs. prostorové přístupové metody (spatial access methods). Prokletí dimenzionality. Distribuce vzdáleností a vnitřní dimenze.
9. Statické MAM: (m)vp-strom, gh-strom, GNAT
10. Dynamické MAM: M-strom + modifikace (Slim-strom, PM-strom, SPM-strom)
11. Pivot-based metody. Globální a lokální pivoty. M-strom vs. LAESA. vp-forest, D-index. Techniky výběru globálních pivotů.
12. Aproximativní a probabilistické metody vyhledávání. AC a PAC dotazování. Nemetrické vyhledávání. Poslední úprava: Skopal Tomáš, prof. RNDr., Ph.D. (20.07.2005)
|