Komprese slovníku
Název práce v češtině: | Komprese slovníku |
---|---|
Název v anglickém jazyce: | Compression of dictionary |
Akademický rok vypsání: | 2006/2007 |
Typ práce: | bakalářská práce |
Jazyk práce: | čeština |
Ústav: | Katedra softwarového inženýrství (32-KSI) |
Vedoucí / školitel: | RNDr. Jan Lánský, Ph.D. |
Řešitel: | skrytý![]() |
Datum přihlášení: | 09.10.2006 |
Datum zadání: | 09.10.2006 |
Datum a čas obhajoby: | 25.06.2007 00:00 |
Datum odevzdání elektronické podoby: | 25.06.2007 |
Datum proběhlé obhajoby: | 25.06.2007 |
Oponenti: | RNDr. Michal Žemlička, Ph.D. |
Zásady pro vypracování |
Metoda TD3 [2] je určena ke kompresi množiny řetězců a je založena na zakódování struktury trie. Své použití nachází například při kódování slovníku použitých elementů u BWT nad velkou abecedou [3]. V metodě TD3 proveďte následující optimalizace: Nahraďte Eliasovy kody za Huffmanovo kódování. Zefektivněte kompresi uzlů, které mají pouze jednoho potomka. Optimalizujte ukládání informace o tom, zda uzel reprezentuje řetězec z dané množiny. Jednotlivé optimalizace otestujte pro reálná data [2, 3]. |
Seznam odborné literatury |
1) Pokorný, J., Žemlička, M.: Základy implementace souboru a databází 2. vydání, Praha, Karolinum 2004.
2) Jan Lánský, Michal Žemlička: Compression of a Dictionary. In: Snášel, V., Richta, K., and Pokorný, J.: Proceedings of the Dateso 2006 Annual International Workshop on DAtabases, TExts, Specifications and Objects. CEUR-WS, Vol. 176, pg. 11-20, ISBN 80-248-1025-5. 3) Leo Galamboš, Jan Lánský, Katsiaryna Chernik: Compression of Semistructured Documents. In: International Enformatika Conference IEC 2006, Enformatika, Transactions on Engineering, Computing and Technology, Volume 14, August 2006, pg. 222-227, ISBN 975-00803-3-5, ISSN 1305-5313 |