Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Srovnání joint-embedding hlubokých sítí pro úlohu hledání známého obrázku
Název práce v češtině: Srovnání joint-embedding hlubokých sítí pro úlohu hledání známého obrázku
Název v anglickém jazyce: Comparison of joint-embedding deep networks for known-item search in image datasets
Klíčová slova: Hluboká síť|Hledání v obrázcích|Srovnávací studie
Klíčová slova anglicky: Deep network|Image search|Comparative study
Akademický rok vypsání: 2024/2025
Typ práce: bakalářská práce
Jazyk práce:
Ústav: Katedra softwarového inženýrství (32-KSI)
Vedoucí / školitel: doc. RNDr. Jakub Lokoč, Ph.D.
Řešitel: Jakub Hajko - zadáno a potvrzeno stud. odd.
Datum přihlášení: 30.04.2024
Datum zadání: 01.05.2024
Datum potvrzení stud. oddělením: 02.05.2024
Zásady pro vypracování
Cílem práce je srovnat několik vybraných modelů hlubokých neuronových sítí v úloze hledání známého obrázku v rozsáhlé kolekci dat. Autor práce otestuje vybrané joint-embedding modely (zejména varianty OpenCLIP) na více datasetech, pro které vytvoří testovací páry obrázek a jeho krátký/dlouhý popis. Součástí práce bude i SW, který bude snadno rozšiřitelný o nové modely a datasety.
Seznam odborné literatury
Jakub Lokoc, Stelios Andreadis, Werner Bailer, Aaron Duane, Cathal Gurrin, Zhixin Ma, Nicola Messina, Thao-Nhu Nguyen, Ladislav Peska, Luca Rossetto, Loris Sauter, Konstantin Schall, Klaus Schoeffmann, Omar Shahbaz Khan, Florian Spiess, Lucia Vadicamo, Stefanos Vrochidis: Interactive video retrieval in the age of effective joint embedding deep models: lessons from the 11th VBS. Multim. Syst. 29(6): 3481-3504 (2023)

Quang-Trung Truong, Tuan-Anh Vu, Tan-Sang Ha, Jakub Lokoc, Yue Him Wong Tim, Ajay Joneja, Sai-Kit Yeung: Marine Video Kit: A New Marine Video Dataset for Content-Based Analysis and Retrieval. MMM (1) 2023: 539-550

Jakub Lokoc, Tomás Soucek, Patrik Veselý, Frantisek Mejzlík, Jiaqi Ji, Chaoxi Xu, Xirong Li: A W2VV++ Case Study with Automated and Interactive Text-to-Video Retrieval. ACM Multimedia 2020: 2553-2561

Ly-Duyen Tran, Manh-Duy Nguyen, Duc-Tien Dang-Nguyen, Silvan Heller, Florian Spiess, Jakub Lokoc, Ladislav Peska, Thao-Nhu Nguyen, Omar Shahbaz Khan, Aaron Duane, Björn Þór Jónsson, Luca Rossetto, An-Zi Yen, Ahmed Alateeq, Naushad Alam, Minh-Triet Tran, Graham Healy, Klaus Schoeffmann, Cathal Gurrin: Comparing Interactive Retrieval Approaches at the Lifelog Search Challenge 2021. IEEE Access 11: 30982-30995 (2023)
 
Univerzita Karlova | Informační systém UK