V sobotu dne 19. 10. 2024 dojde k odstávce některých součástí informačního systému. Nedostupná bude zejména práce se soubory v modulech závěrečných prací. Svoje požadavky, prosím, odložte na pozdější dobu. |
Datové struktury pro sketching dynamických množin
Název práce v češtině: | Datové struktury pro sketching dynamických množin |
---|---|
Název v anglickém jazyce: | Data Structures for Sketching Dynamic Sets |
Klíčová slova: | lineární sketching|rekonstrukce množin|Bloomův filtr|proudové algoritmy|souhrny dat |
Klíčová slova anglicky: | linear sketching|set reconstruction|Bloom filter|streaming algorithms|data summaries |
Akademický rok vypsání: | 2023/2024 |
Typ práce: | bakalářská práce |
Jazyk práce: | čeština |
Ústav: | Informatický ústav Univerzity Karlovy (32-IUUK) |
Vedoucí / školitel: | Mgr. Pavel Veselý, Ph.D. |
Řešitel: | skrytý - zadáno a potvrzeno stud. odd. |
Datum přihlášení: | 21.09.2023 |
Datum zadání: | 26.09.2023 |
Datum potvrzení stud. oddělením: | 09.10.2023 |
Datum a čas obhajoby: | 05.09.2024 10:00 |
Datum odevzdání elektronické podoby: | 17.07.2024 |
Datum odevzdání tištěné podoby: | 17.07.2024 |
Datum proběhlé obhajoby: | 05.09.2024 |
Oponenti: | Mgr. Tomáš Petříček, Ph.D. |
Zásady pro vypracování |
Řešitel si nastuduje nejlepší známé paměťově efektivní datové struktury pro rekonstrukci množin a multimnožin daných dlouhou posloupností přidávání a mazání prvků. Cílem je experimentálně prozkoumat vlastnosti nové datové struktury pro rekonstrukci množin z článku [1] a porovnat ji se starší datovou strukturou zvanou "Invertible Bloom Lookup Table" (IBLT) [2]. Jednou z aplikací, kterou řešitel může prozkoumat, je výpočet symetrických diferencí dvou podobných množin genomických dat [3]. |
Seznam odborné literatury |
[1] Bæk Tejs Houen, Jakob, Rasmus Pagh, and Stefan Walzer. "Simple Set Sketching." In Symposium on Simplicity in Algorithms (SOSA), pp. 228-241. Society for Industrial and Applied Mathematics, 2023.
[2] Goodrich, Michael T., and Michael Mitzenmacher. "Invertible bloom lookup tables." In 2011 49th Annual Allerton Conference on Communication, Control, and Computing (Allerton), pp. 792-799. IEEE, 2011. [3] Shibuya, Yoshihiro, Djamal Belazzougui, and Gregory Kucherov. "Efficient reconciliation of genomic datasets of high similarity." bioRxiv (2022): 2022-06. [4] Fleischhacker, Nils, Kasper Green Larsen, Maciej Obremski, and Mark Simkin. "Invertible bloom lookup tables with less memory and randomness." Cryptology ePrint Archive (2023). [5] Cormode, Graham, and Ke Yi. Small summaries for big data. Cambridge University Press, 2020. |