Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 390)
Detail práce
   Přihlásit přes CAS
Optimization of Processing of Data Files in System DIRAC
Název práce v češtině: Optimization of Processing of Data Files in System DIRAC
Název v anglickém jazyce: Optimization of Processing of Data Files in System DIRAC
Klíčová slova: Systém DIRAC, NoSQL databáze, efektivní zpracování datových souborů, dotazování nad metadaty
Klíčová slova anglicky: System DIRAC, NoSQL databases, efficient processing of data files, metadata querying.
Akademický rok vypsání: 2014/2015
Typ práce: bakalářská práce
Jazyk práce: angličtina
Ústav: Katedra softwarového inženýrství (32-KSI)
Vedoucí / školitel: doc. RNDr. Irena Holubová, Ph.D.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 23.05.2015
Datum zadání: 25.05.2015
Datum potvrzení stud. oddělením: 02.06.2015
Datum a čas obhajoby: 02.02.2016 00:00
Datum odevzdání elektronické podoby:03.12.2015
Datum odevzdání tištěné podoby:04.12.2015
Datum proběhlé obhajoby: 02.02.2016
Oponenti: RNDr. Martin Svoboda, Ph.D.
 
 
 
Konzultanti: RNDr. Jiří Chudoba, Ph.D.
Dagmar Adamová
Zásady pro vypracování
The aim of the thesis is to study and extend processing of data files stored in the distributed system DIRAC and in particular their related metadata. The author will analyze the current functionality and extend it with more sophisticated work with data files and their metadata, such as creating, deleting, and updating of data sets, and basic querying over metadata. The functionality will be discussed with the consultants of the thesis.
In the second phase of the work, the author will identify parts of the current metadata storage which are suitable for storing in a NoSQL database. On the basis of an analysis of existing NoSQL systems the author will select appropriate system(s), propose suitable storage strategy/strategies, and experimentally evaluate their features using real-world data. The results will also be compared with the features of the current storage strategy based on a relational database.
Seznam odborné literatury
Tsaregorodtsev, A.: DIRAC Distributed Computing Services, 2014 J. Phys.: Conf. Ser. 513 (2014)

Tsaregorodtsev, A. - Poss, S.: DIRAC File Replica and Metadata Catalog. Journal of Physics: Conference Series. 2012, 396(3)

Sadalage, P.J. – Fowler, M.: NoSQL Distilled: A Brief Guide to the Emerging World of Polyglot Persistence

Redmond, E. – Wilson, J.R.: Seven Databases in Seven Weeks: A Guide to Modern Databases and the NoSQL Movement
 
Univerzita Karlova | Informační systém UK