velikost textu

Query by Pictorial Example

Upozornění: Informace získané z popisných dat či souborů uložených v Repozitáři závěrečných prací nemohou být použity k výdělečným účelům nebo vydávány za studijní, vědeckou nebo jinou tvůrčí činnost jiné osoby než autora.
Název:
Query by Pictorial Example
Název v češtině:
Indexace obrazové databáze
Typ:
Disertační práce
Autor:
RNDr. Pavel Vácha, Ph.D.
Školitel:
prof. Ing. Michal Haindl, DrSc.
Oponenti:
Ing. Ondřej Drbohlav, Dr.
Jan-Mark Geusebroek
Id práce:
41049
Fakulta:
Matematicko-fyzikální fakulta (MFF)
Pracoviště:
Ústav teorie informace a automatizace AV ČR, v.v.i. (32-UTIAAV)
Program studia:
Informatika (P1801)
Obor studia:
Softwarové systémy (I2)
Přidělovaný titul:
Ph.D.
Datum obhajoby:
5. 4. 2011
Výsledek obhajoby:
Prospěl/a
Jazyk práce:
Angličtina
Klíčová slova:
textura, barva, světelná invariance, rotační invariance, Markovovo náhodné pole, prohledávání obrazových databází
Klíčová slova v angličtině:
texture, color, illumination invariance, rotation invariance, Markov random field, content based image retrieval
Abstrakt:
Rostoucí množství digitálních fotografií vyžaduje nové metody třídění, organizace a vy- hledávání. Toto je úkolem CBIR systémů, což jsou databázové systémy specializované na prohledávání rozsáhlých obrazových databází. Uživatel typicky zadá vstupní obrázek nebo sérii obrázků a úkolem CBIR systému je nalézt v databázi obrázky co nejvíce po- dobné. V ideálním případě by nalezené obrázky neměli záviset podmínkách, ve kterých byly pořízeny. Bohužel vzhled mnoha objektů a přírodních materiálů velmi závisí na světelných podmínkách a úhlu pohledu. Tato práce se zaměřuje na reprezentaci a vyhledávání homogenních obrazů (textur) a odolnost této reprezentace vůči změnám osvětlení a otočení textury. Navrhujeme nové světelně invariantní texturní příznaky, která jsou založené na Markovovském modelování prostorových vztahů v textuře. Textura je modelována kauzálním autoregresním mode- lem (CAR) nebo Gaussovsko-Markovovským modelem náhodného pole (GMRF), které umožňují velmi efektivní odhad svých parametrů, bez použití časově náročné Monte Carlo minimalizace. Odhadnuté parametry jsou následně transformovány do světelných invari- antů, které reprezentují texturu. Odvodili jsme, že tato texturní reprezentace je invariantní ke změně intensity a barvy/spektra osvětlení a je také téměř invariantní k lokálním změnám intensity (např. vržené stíny). Provedené experimenty navíc ukázaly, že navrhované tex- turní příznaky jsou robustní ke změnám směru osvětlení a degradaci obrázků Gaussovským šumem. Navrženou texturní reprezentaci jsme rozšířili, aby byla zároveň světelně i rotačně invariantní. Navrhované texturní příznaky byly otestovány na pěti různých texturních databázích (Outex, Bonn BTF, CUReT, ALOT a KTH-TIPS2). Provedené experimenty, odpovídající reálným podmínkám, potvrdily, že představené texturní příznaky jsou schopné rozpoznat přírodní materiály za různých světelných podmínek a při různém směru pohledu. Výsledky navržené reprezentace překonaly nejlepší alternativní texturní reprezentace jako oponentní Gaborovy příznaky, LBP, LBP-HF a MR8-LINC v téměř všech experimentech. Naše metody pracují bez znalosti podmínek při pořízení snímku a rozpoznávání je možné i s jediným trénovacím obrázkem pro každý materiál, pokud není obsažena výrazná změna měřítka nebo perspektivní projekce. Psychovizuální experimenty také naznačují, že naše metody pro posuzování texturní podobnosti odpovídají lidskému vnímání textur. Navržené příznaky byly využity při konstrukci systému pro vyhledávaní podobných ob- kladů a začleněny do algoritmu pro segmentaci textur. Také jsme ukázali možné aplikace pro optimalizaci parametrů při kompresi textur a rozpoznávání glaukomické tkáně na snímcích sítnice. Prezentované metody mohou být využity pro zlepšení funkčnosti stávajících CBIR systémů nebo pro konstrukci specializovaných systémů zaměřených např. na texturní me- dicínské snímky nebo na obklady jako v prezentovaném systému. Další možnosti aplikací se nachází v počítačovém vidění, protože analýza reálných scén často vyžaduje popis textur při měnících se světelných podmínkách.
Abstract v angličtině:
Ongoing expansion of digital images requires new methods for sorting, browsing, and sear- ching through huge image databases. This is a domain of Content-Based Image Retrieval (CBIR) systems, which are database search engines for images. A user typically submit a query image or series of images and the CBIR system tries to find and to retrieve the most similar images from the database. Optimally, the retrieved images should not be sensitive to circumstances during their acquisition. Unfortunately, the appearance of natural objects and materials is highly illumination and viewpoint dependent. This work focuses on representation and retrieval of homogeneous images, called textu- res, under the circumstances with variable illumination and texture rotation. We propose a novel illumination invariant textural features based on Markovian modelling of spatial tex- ture relations. The texture is modelled by Causal Autoregressive Random field (CAR) or Gaussian Markov Random Field (GMRF) models, which allow a very efficient estimation of its parameters, without the demanding Monte Carlo minimisation. Subsequently, the estimated model parameters are transformed into the new illumination invariants, which represent the texture. We derived that our textural representation is invariant to changes of illumination intensity and colour/spectrum, and also approximately invariant to local intensity variation (e.g. cast shadows). On top of that, our experiments showed that the proposed features are robust to illumination direction variations and the image degradation with an additive Gaussian noise. The textural representation is extended to be simultane- ously illumination and rotation invariant. The proposed features were tested in experiments on five different textural databases (Outex, Bonn BTF, CUReT, ALOT, and KTH-TIPS2). The experiments, closely resembling real-life conditions, confirmed that the proposed features are able to recognise materials in variable illumination conditions and different viewpoint directions. The proposed represen- tation outperformed other state of the art textural representations (among others opponent Gabor features, LBP, LBP-HF, and MR8-LINC) in the almost all experiments. Our me- thods do not require any knowledge of acquisition conditions and the recognition is possible even with a single training image per material, if substantial scale variation or perspective projection is not included. The psychophysical experiments also indicated that our methods for the evaluation of textural similarity are related to the human perception of textures. Four applications of our invariant features are presented. We developed a CBIR system, which retrieves similar tiles. We integrated the invariants into a texture segmentation algo- rithm. And feasible applications were demonstrated in optimisation of texture compression parameters and recognition of glaucomatous tissue in retina images. We expect that the presented methods can improve the performance of existing CBIR systems or they can be utilised in specialised CBIR systems focused on e.g. textural medical images or tiles as in the presented system. Other applications include computer vision, since the analysis of real scenes often requires a description of textures under various light conditions.
Dokumenty
Stáhnout Dokument Autor Typ Velikost
Stáhnout Text práce RNDr. Pavel Vácha, Ph.D. 5.83 MB
Stáhnout Abstrakt v českém jazyce RNDr. Pavel Vácha, Ph.D. 17 kB
Stáhnout Abstrakt anglicky RNDr. Pavel Vácha, Ph.D. 17 kB
Stáhnout Posudek vedoucího prof. Ing. Michal Haindl, DrSc. 47 kB
Stáhnout Posudek oponenta Ing. Ondřej Drbohlav, Dr. 42 kB
Stáhnout Posudek oponenta Jan-Mark Geusebroek 165 kB
Stáhnout Záznam o průběhu obhajoby 45 kB