Komprese slovníku
Thesis title in Czech: | Komprese slovníku |
---|---|
Thesis title in English: | Compression of dictionary |
Academic year of topic announcement: | 2006/2007 |
Thesis type: | Bachelor's thesis |
Thesis language: | čeština |
Department: | Department of Software Engineering (32-KSI) |
Supervisor: | RNDr. Jan Lánský, Ph.D. |
Author: | hidden![]() |
Date of registration: | 09.10.2006 |
Date of assignment: | 09.10.2006 |
Date and time of defence: | 25.06.2007 00:00 |
Date of electronic submission: | 25.06.2007 |
Date of proceeded defence: | 25.06.2007 |
Opponents: | RNDr. Michal Žemlička, Ph.D. |
Guidelines |
Metoda TD3 [2] je určena ke kompresi množiny řetězců a je založena na zakódování struktury trie. Své použití nachází například při kódování slovníku použitých elementů u BWT nad velkou abecedou [3]. V metodě TD3 proveďte následující optimalizace: Nahraďte Eliasovy kody za Huffmanovo kódování. Zefektivněte kompresi uzlů, které mají pouze jednoho potomka. Optimalizujte ukládání informace o tom, zda uzel reprezentuje řetězec z dané množiny. Jednotlivé optimalizace otestujte pro reálná data [2, 3]. |
References |
1) Pokorný, J., Žemlička, M.: Základy implementace souboru a databází 2. vydání, Praha, Karolinum 2004.
2) Jan Lánský, Michal Žemlička: Compression of a Dictionary. In: Snášel, V., Richta, K., and Pokorný, J.: Proceedings of the Dateso 2006 Annual International Workshop on DAtabases, TExts, Specifications and Objects. CEUR-WS, Vol. 176, pg. 11-20, ISBN 80-248-1025-5. 3) Leo Galamboš, Jan Lánský, Katsiaryna Chernik: Compression of Semistructured Documents. In: International Enformatika Conference IEC 2006, Enformatika, Transactions on Engineering, Computing and Technology, Volume 14, August 2006, pg. 222-227, ISBN 975-00803-3-5, ISSN 1305-5313 |