Thesis (Selection of subject)Thesis (Selection of subject)(version: 368)
Thesis details
   Login via CAS
Srovnání joint-embedding hlubokých sítí pro úlohu hledání známého obrázku
Thesis title in Czech: Srovnání joint-embedding hlubokých sítí pro úlohu hledání známého obrázku
Thesis title in English: Comparison of joint-embedding deep networks for known-item search in image datasets
Key words: Hluboká síť|Hledání v obrázcích|Srovnávací studie
English key words: Deep network|Image search|Comparative study
Academic year of topic announcement: 2024/2025
Thesis type: Bachelor's thesis
Thesis language:
Department: Department of Software Engineering (32-KSI)
Supervisor: doc. RNDr. Jakub Lokoč, Ph.D.
Author: Jakub Hajko - assigned and confirmed by the Study Dept.
Date of registration: 30.04.2024
Date of assignment: 01.05.2024
Confirmed by Study dept. on: 02.05.2024
Guidelines
Cílem práce je srovnat několik vybraných modelů hlubokých neuronových sítí v úloze hledání známého obrázku v rozsáhlé kolekci dat. Autor práce otestuje vybrané joint-embedding modely (zejména varianty OpenCLIP) na více datasetech, pro které vytvoří testovací páry obrázek a jeho krátký/dlouhý popis. Součástí práce bude i SW, který bude snadno rozšiřitelný o nové modely a datasety.
References
Jakub Lokoc, Stelios Andreadis, Werner Bailer, Aaron Duane, Cathal Gurrin, Zhixin Ma, Nicola Messina, Thao-Nhu Nguyen, Ladislav Peska, Luca Rossetto, Loris Sauter, Konstantin Schall, Klaus Schoeffmann, Omar Shahbaz Khan, Florian Spiess, Lucia Vadicamo, Stefanos Vrochidis: Interactive video retrieval in the age of effective joint embedding deep models: lessons from the 11th VBS. Multim. Syst. 29(6): 3481-3504 (2023)

Quang-Trung Truong, Tuan-Anh Vu, Tan-Sang Ha, Jakub Lokoc, Yue Him Wong Tim, Ajay Joneja, Sai-Kit Yeung: Marine Video Kit: A New Marine Video Dataset for Content-Based Analysis and Retrieval. MMM (1) 2023: 539-550

Jakub Lokoc, Tomás Soucek, Patrik Veselý, Frantisek Mejzlík, Jiaqi Ji, Chaoxi Xu, Xirong Li: A W2VV++ Case Study with Automated and Interactive Text-to-Video Retrieval. ACM Multimedia 2020: 2553-2561

Ly-Duyen Tran, Manh-Duy Nguyen, Duc-Tien Dang-Nguyen, Silvan Heller, Florian Spiess, Jakub Lokoc, Ladislav Peska, Thao-Nhu Nguyen, Omar Shahbaz Khan, Aaron Duane, Björn Þór Jónsson, Luca Rossetto, An-Zi Yen, Ahmed Alateeq, Naushad Alam, Minh-Triet Tran, Graham Healy, Klaus Schoeffmann, Cathal Gurrin: Comparing Interactive Retrieval Approaches at the Lifelog Search Challenge 2021. IEEE Access 11: 30982-30995 (2023)
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html