Thesis (Selection of subject)Thesis (Selection of subject)(version: 390)
Thesis details
   Login via CAS
Komprese slovníku
Thesis title in Czech: Komprese slovníku
Thesis title in English: Compression of dictionary
Academic year of topic announcement: 2006/2007
Thesis type: Bachelor's thesis
Thesis language: čeština
Department: Department of Software Engineering (32-KSI)
Supervisor: RNDr. Jan Lánský, Ph.D.
Author: hidden - assigned and confirmed by the Study Dept.
Date of registration: 09.10.2006
Date of assignment: 09.10.2006
Date and time of defence: 25.06.2007 00:00
Date of electronic submission:25.06.2007
Date of proceeded defence: 25.06.2007
Opponents: RNDr. Michal Žemlička, Ph.D.
 
 
 
Guidelines
Metoda TD3 [2] je určena ke kompresi množiny řetězců a je založena na zakódování struktury trie. Své použití nachází například při kódování slovníku použitých elementů u BWT nad velkou abecedou [3]. V metodě TD3 proveďte následující optimalizace: Nahraďte Eliasovy kody za Huffmanovo kódování. Zefektivněte kompresi uzlů, které mají pouze jednoho potomka. Optimalizujte ukládání informace o tom, zda uzel reprezentuje řetězec z dané množiny. Jednotlivé optimalizace otestujte pro reálná data [2, 3].
References
1) Pokorný, J., Žemlička, M.: Základy implementace souboru a databází 2. vydání, Praha, Karolinum 2004.
2) Jan Lánský, Michal Žemlička: Compression of a Dictionary. In: Snášel, V., Richta, K., and Pokorný, J.: Proceedings of the Dateso 2006 Annual International Workshop on DAtabases, TExts, Specifications and Objects. CEUR-WS, Vol. 176, pg. 11-20, ISBN 80-248-1025-5.
3) Leo Galamboš, Jan Lánský, Katsiaryna Chernik: Compression of Semistructured Documents. In: International Enformatika Conference IEC 2006, Enformatika, Transactions on Engineering, Computing and Technology, Volume 14, August 2006, pg. 222-227, ISBN 975-00803-3-5, ISSN 1305-5313
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html