Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 390)
Detail práce
   Přihlásit přes CAS
Komprese slovníku
Název práce v češtině: Komprese slovníku
Název v anglickém jazyce: Compression of dictionary
Akademický rok vypsání: 2006/2007
Typ práce: bakalářská práce
Jazyk práce: čeština
Ústav: Katedra softwarového inženýrství (32-KSI)
Vedoucí / školitel: RNDr. Jan Lánský, Ph.D.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 09.10.2006
Datum zadání: 09.10.2006
Datum a čas obhajoby: 25.06.2007 00:00
Datum odevzdání elektronické podoby:25.06.2007
Datum proběhlé obhajoby: 25.06.2007
Oponenti: RNDr. Michal Žemlička, Ph.D.
 
 
 
Zásady pro vypracování
Metoda TD3 [2] je určena ke kompresi množiny řetězců a je založena na zakódování struktury trie. Své použití nachází například při kódování slovníku použitých elementů u BWT nad velkou abecedou [3]. V metodě TD3 proveďte následující optimalizace: Nahraďte Eliasovy kody za Huffmanovo kódování. Zefektivněte kompresi uzlů, které mají pouze jednoho potomka. Optimalizujte ukládání informace o tom, zda uzel reprezentuje řetězec z dané množiny. Jednotlivé optimalizace otestujte pro reálná data [2, 3].
Seznam odborné literatury
1) Pokorný, J., Žemlička, M.: Základy implementace souboru a databází 2. vydání, Praha, Karolinum 2004.
2) Jan Lánský, Michal Žemlička: Compression of a Dictionary. In: Snášel, V., Richta, K., and Pokorný, J.: Proceedings of the Dateso 2006 Annual International Workshop on DAtabases, TExts, Specifications and Objects. CEUR-WS, Vol. 176, pg. 11-20, ISBN 80-248-1025-5.
3) Leo Galamboš, Jan Lánský, Katsiaryna Chernik: Compression of Semistructured Documents. In: International Enformatika Conference IEC 2006, Enformatika, Transactions on Engineering, Computing and Technology, Volume 14, August 2006, pg. 222-227, ISBN 975-00803-3-5, ISSN 1305-5313
 
Univerzita Karlova | Informační systém UK