Integrace invertovaných indexů ve federovaných databázích
Název práce v češtině: | Integrace invertovaných indexů ve federovaných databázích |
---|---|
Název v anglickém jazyce: | Inverted index integration in federated databases |
Klíčová slova: | federovaná databáze; invertovaný index; spojení |
Klíčová slova anglicky: | federated database; inverted index; join |
Akademický rok vypsání: | 2023/2024 |
Typ práce: | diplomová práce |
Jazyk práce: | |
Ústav: | Katedra softwarového inženýrství (32-KSI) |
Vedoucí / školitel: | RNDr. David Bednárek, Ph.D. |
Řešitel: |
Zásady pro vypracování |
Vyhledávání dat pomocí invertovaných indexů je efektivní a často používaná metoda vyhodnocování komplikovaných dotazů nad vysokodimenzionálními nebo textovými datasety. Současné systémy již zvládají i federované dotazy kommbinující různé zdroje dat, efektivita takových dotazů je však zatím problematická.
Cílem práce je vytvořit systém indexování dat, který existující vysokorychlostní vyhledávání pomocí invertovaných indexů rozšíří o schopnost efektivně indexovat a při vyhledávání zohledňovat externí odkazy mezi datasety. |
Seznam odborné literatury |
Agrafiotis, D. K., Lobanov, V. S., Shemanarev, M., Rassokhin, D. N., Izrailev, S., Jaeger, E. P., ... & Farnum, M. (2011). Efficient substructure searching of large chemical libraries: the ABCD chemical cartridge. Journal of chemical information and modeling, 51(12), 3113-3130.
Jia, L., Zhang, L., Yu, G., You, J., Ding, J., & Li, M. (2018). A Survey on Set Similarity Search and Join. International Journal of Performability Engineering, 14(2). Yang, J., Zhang, W., Yang, S., Zhang, Y., & Lin, X. (2017, April). Tt-join: Efficient set containment join. In 2017 IEEE 33rd International Conference on Data Engineering (ICDE) (pp. 509-520). IEEE. |