Organizace a zpracování dat II - NDBI003
Anglický název: Data Organisation and Processing II
Zajišťuje: Katedra softwarového inženýrství (32-KSI)
Fakulta: Matematicko-fyzikální fakulta
Platnost: od 2014
Semestr: letní
E-Kredity: 5
Rozsah, examinace: letní s.:2/1, Z+Zk [HT]
Počet míst: neomezen
Minimální obsazenost: neomezen
4EU+: ne
Virtuální mobilita / počet míst pro virtuální mobilitu: ne
Stav předmětu: zrušen
Jazyk výuky: čeština
Způsob výuky: prezenční
Způsob výuky: prezenční
Další informace: http://siret.ms.mff.cuni.cz/members/hoksza/lectures/ndbi003
Garant: doc. RNDr. David Hoksza, Ph.D.
Třída: Informatika Mgr. - Softwarové systémy
Kategorizace předmětu: Informatika > Databázové systémy
Výsledky anket   Termíny zkoušek   Rozvrh   Nástěnka   
Anotace -
Poslední úprava: G_I (16.03.2011)
Prostorové databáze. Hledání v textových kolekcích. Možnosti redukce lemmat, Zipfův zákon, signaturové metody. Komprese dat. Indexace semistrukturovaných dokumentů. Persistence objektů. Předpokládají se znalosti v rozsahu bakalářského kursu NDBI007 Organizace a zpracování dat I.
Literatura
Poslední úprava: T_KSI (15.04.2003)

Pokorný, J.: Základy implementace souborů a databází. Skripta UK, Vydavatelství Karolinum, 1997.

Pokorný, J., Žemlička, M.: Základy implementace souborů a databází. Skripta UK, Vydavatelství Karolinum, 2003. 2. uprav. vydání.

Sylabus -
Poslední úprava: T_KSI (15.04.2003)

1. Prostorové databáze - k čemu slouží, čím se liší od relačních db; rd-stromy, reprezentace prostoru (naivní, spirálovité, z-uspořádání; uspořádání cestou a do šířky).

2. Prostorové databáze - datové struktury určené pro primárně pro body (B-kostky, k-d-stromy, buddy-stromy).

3. Prostorové databáze - datové struktury využitelné i pro komplexní objekty (R-stromy, R*-stromy).

4. Prostorové databáze - prostorová spojení.

5. Hledání v textových kolekcích - úvod: invertovaný soubor, co je to lemmatizace a jak fungují triviální implementace; Možnosti redukce lemmat, Zipfův zákon.

6. Hledání v textových kolekcích - signaturové metody (signatura dotazu a dokumentu, vrstvené signatury, S-stromy, víceúrovňové signatury).

7. Komprese dat - k čemu slouží, základní pojmy, kódování přirozených čísel.

8. Komprese dat - metody kódující symboly (Shannon-Fano, Huffman, aritmetické kódování).

9. Komprese dat - základní slovníkové metody 1 (LZ77,LZ78).

10. Komprese dat - základní slovníkové metody 2 (LZW,BSTW), komprese a kompakce indexů.

11. Indexace semistrukturovaných dokumentů.

12. Indexace webu.

13. Persistence objektů.