Témata prací (Výběr práce)

Váš prohlížeč nepodporuje JavaScript nebo je jeho podpora vypnutá. Některé funkce nemusejí být dostupné.

Kontextové modely pro statistickou kompresi dat

Název práce v češtině:	Kontextové modely pro statistickou kompresi dat
Název v anglickém jazyce:	Context modelling for statistical data compression
Akademický rok vypsání:	2005/2006
Typ práce:	diplomová práce
Jazyk práce:	angličtina
Ústav:	Katedra softwaru a výuky informatiky (32-KSVI)
Vedoucí / školitel:	doc. RNDr. Tomáš Dvořák, CSc.
Řešitel:	skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení:	11.11.2005
Datum zadání:	11.11.2005
Datum a čas obhajoby:	24.09.2008 00:00
Datum odevzdání elektronické podoby:	24.09.2008
Datum odevzdání tištěné podoby:	24.09.2008
Datum proběhlé obhajoby:	24.09.2008
Oponenti:	RNDr. Michal Žemlička, Ph.D.

Zásady pro vypracování

Klasické statistické metody bezztrátové komprese dat se obvykle popisují jako algoritmy tvořené dvěma relativně nezávislými fázemi - modelováním a kódováním. Zatímco problém kódování je považován za poměrně uspokojivě vyřešený, otázka tvorby statistického modelu dat je stále předmětem výzkumu. Ačkoli praktické využití komplikovanějších modelů, které obvykle vedou k lepšímu kompresnímu poměru (např. modely typu PPM), v minulosti často naráželo na vysokou prostorovou i časovou náročnost [1,6], v nedávné práci [2] byla navržena řada heuristik a aproximací, které dle publikovaných experimentálních výsledků tento problém částečně eliminují.

Autor by měl nejprve prozkoumat známé přístupy ke tvorbě modelů dat a poté se je pokusit zobecnit se zaměřením na maximální dosahovaný kompresní poměr. Doporučuji pokusit se navázat na myšlenky autorů [2,3] s tím, že kromě obvyklých statistik na úrovni znaků budou uvažovány i modely na vyšší úrovni (slova [4], slabiky [5]) či jejich kombinace, využívající i jiné nežli lineární funkce.

Seznam odborné literatury

[1] A.Moffat, A.Turpin: Compression and Coding Algorithms. Kluwer Academic Publishers, 2002.

[2] D.Škarin: PPM: One Step to Practicality. Proceedings of the IEEE Data Compression Conference (DCC'2002), 202-211, 2002.

[3] M.Mahoney: The PAQ Data Compression Programs. http://www.cs.fit.edu/~mmahoney/compression/

[4] J.Dvorský: Word-based compression methods for information retrieval systems. Diplomová práce MFF UK, Praha, 2003.

[5] J.Lánský, M.Žemlička: Text compression: Syllables. In DATESO 2005, ed. by K.Richta, J.Snášel and J.Pokorný, Praha, 2005, pp. 32-45.

[6] T.C.Bell, J.G.Cleary, I.H.Witten: Text compression. Prentice Hall, 1990.

Předběžná náplň práce

Cílem práce je porovnat známé přístupy k modelování dat pro statistickou kompresi a pokusit se o jejich zobecnění se zaměřením na maximální kompresní poměr.