Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Algoritmy konstrukce sufixového pole
Název práce v češtině: Algoritmy konstrukce sufixového pole
Název v anglickém jazyce: Suffix array construction algorithms
Akademický rok vypsání: 2005/2006
Typ práce: diplomová práce
Jazyk práce: čeština
Ústav: Katedra softwaru a výuky informatiky (32-KSVI)
Vedoucí / školitel: doc. RNDr. Tomáš Dvořák, CSc.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 11.11.2005
Datum zadání: 11.11.2005
Datum a čas obhajoby: 05.02.2007 00:00
Datum odevzdání elektronické podoby:05.02.2007
Datum proběhlé obhajoby: 05.02.2007
Oponenti: RNDr. Jan Lánský, Ph.D.
 
 
 
Zásady pro vypracování
Sufixové pole je datová struktura, navržená v roce 1990 Manberem a Myersem [1] jako prostorově úsporná varianta sufixového stromu, která je využívána pro zpracování řetězců i kompresi dat (implementace Burrows-Wheelerovy transformace). V poslední době byly publikovány jak konstrukční algoritmy pracující v lineárním čase [2,3], tak algoritmy se složitostí v nejhorším případě superlineární [4,5], které jsou však při praktickém použití obvykle rychlejší.

Autor by se měl na základě studia publikovaných algoritmů pokusit vytvořit taxonomii známých metod pro konstrukci sufixového pole, na tomto základě vybrat několik typických reprezentantů, implementovat je v jednotném prostředí a poté porovnat jejich efektivitu. Doporučuji provést nejen obvyklý odhad časové náročnosti na vhodně vybraném souboru experimentálních dat, ale pokusit se též o konstrukci mezních případů, které by odhalily slabiny jednotlivých algoritmů. Zajímavé by bylo též srovnání s příbuznými sufixovými datovými strukturami (např. sufixový strom).
Seznam odborné literatury
[1] U.Manber, G.Myers: Suffix arrays: A new mathod for online string searches. Proc. First ACM-SIAM Symp. on Discrete Algs. (1990), 319-327.

[2] P.Ko, S.Aluru: Space efficient linear time construction of suffix arrays. Proc. 14th Annual Symp. on Pattern Matching, LNCS 2676, Springer, 2003, 200-210.

[3] J.Karkkainen, P.Sanders: Simple linear work suffix array construction. Proc. 30th International Colloquium on Automata, Languages and Programming, LNCS 2719, Springer, 2003, 943-955.

[4] S.Burkhardt, J. Karkkainen: Fast lightweight suffix array construction and checking. Proc. 14th Annual Symp. Combinatorial Pattern Matching, LNCS 2676, Springer, 2003, 55-69.

[5] G.Manzini, P.Ferragina: Engineering a lightweight suffix array construction algorithm. Algorithmica 40(2004), 33-50.

Předběžná náplň práce
Cílem práce je provést praktické porovnání efektivity algoritmů pro konstrukci sufixového pole.
 
Univerzita Karlova | Informační systém UK