PředmětyPředměty(verze: 806)
Předmět, akademický rok 2017/2018
   Přihlásit přes CAS
Organizace a zpracování dat II - NDBI003
Anglický název: Data Organisation and Processing II
Zajišťuje: Katedra softwarového inženýrství (32-KSI)
Fakulta: Matematicko-fyzikální fakulta
Platnost: od 2014
Semestr: letní
E-Kredity: 5
Rozsah, examinace: letní s.:2/1 Z+Zk [hodiny/týden]
Počet míst: neomezen
Minimální obsazenost: neomezen
Stav předmětu: zrušen
Jazyk výuky: čeština
Způsob výuky: prezenční
Další informace: http://siret.ms.mff.cuni.cz/members/hoksza/lectures/ndbi003
Garant: RNDr. David Hoksza, Ph.D.
Třída: Informatika Mgr. - Softwarové systémy
Kategorizace předmětu: Informatika > Databázové systémy
Anotace -
Poslední úprava: G_I (16.03.2011)

Prostorové databáze. Hledání v textových kolekcích. Možnosti redukce lemmat, Zipfův zákon, signaturové metody. Komprese dat. Indexace semistrukturovaných dokumentů. Persistence objektů. Předpokládají se znalosti v rozsahu bakalářského kursu NDBI007 Organizace a zpracování dat I.
Literatura
Poslední úprava: T_KSI (15.04.2003)

Pokorný, J.: Základy implementace souborů a databází. Skripta UK, Vydavatelství Karolinum, 1997.

Pokorný, J., Žemlička, M.: Základy implementace souborů a databází. Skripta UK, Vydavatelství Karolinum, 2003. 2. uprav. vydání.

Sylabus -
Poslední úprava: T_KSI (15.04.2003)

1. Prostorové databáze - k čemu slouží, čím se liší od relačních db; rd-stromy, reprezentace prostoru (naivní, spirálovité, z-uspořádání; uspořádání cestou a do šířky).

2. Prostorové databáze - datové struktury určené pro primárně pro body (B-kostky, k-d-stromy, buddy-stromy).

3. Prostorové databáze - datové struktury využitelné i pro komplexní objekty (R-stromy, R*-stromy).

4. Prostorové databáze - prostorová spojení.

5. Hledání v textových kolekcích - úvod: invertovaný soubor, co je to lemmatizace a jak fungují triviální implementace; Možnosti redukce lemmat, Zipfův zákon.

6. Hledání v textových kolekcích - signaturové metody (signatura dotazu a dokumentu, vrstvené signatury, S-stromy, víceúrovňové signatury).

7. Komprese dat - k čemu slouží, základní pojmy, kódování přirozených čísel.

8. Komprese dat - metody kódující symboly (Shannon-Fano, Huffman, aritmetické kódování).

9. Komprese dat - základní slovníkové metody 1 (LZ77,LZ78).

10. Komprese dat - základní slovníkové metody 2 (LZW,BSTW), komprese a kompakce indexů.

11. Indexace semistrukturovaných dokumentů.

12. Indexace webu.

13. Persistence objektů.

 
Univerzita Karlova | Informační systém UK