Thesis (Selection of subject)Thesis (Selection of subject)(version: 368)
Thesis details
   Login via CAS
Suffix tree construction with minimized branching
Thesis title in Czech: Suffix tree construction with minimized branching
Thesis title in English: Suffix tree construction with minimized branching
Key words: sufixový strom, konstrukční algoritmus, minimalizace větvení
English key words: suffix tree, construction algorithm, minimization of branching
Academic year of topic announcement: 2010/2011
Thesis type: diploma thesis
Thesis language: angličtina
Department: Department of Software and Computer Science Education (32-KSVI)
Supervisor: doc. RNDr. Tomáš Dvořák, CSc.
Author: hidden - assigned and confirmed by the Study Dept.
Date of registration: 12.11.2010
Date of assignment: 12.11.2010
Date and time of defence: 03.09.2012 09:00
Date of electronic submission:03.08.2012
Date of submission of printed version:03.08.2012
Date of proceeded defence: 03.09.2012
Opponents: Mgr. Rudolf Kadlec, Ph.D.
 
 
 
Guidelines
Sufixový strom je datová struktura, navržená jako prostorově úsporná reprezentace všech přípon daného slova, která umožňuje efektivní řešení řady vyhledávacích problémů [1]. Klasické konstrukční algoritmy [2-3], které se liší pouze seskupením prováděných kroků [4], používají k rychlému procházení stromem stejnou strategii, založenou na existenci sufixových hran. V práci [5] je navrženo alternativní řešení tohoto problému, založené na minimalizaci počtu větvení, které představují časově nejnáročnější operace celé kostrukce. Tento postup, který by měl vést k vyšší efektivitě v praxi, ovšem v nejhorším případě dosahuje vyšší časové složitosti nežli klasické řešení.

Cílem práce je implementace a experimentální analýza efektivity metody [5]. Součástí vyhodnocení by mělo být srovnání s diskově-orientovanými algoritmy, které sice v nejhorším případě dosahují kvadratické časové složitosti, ale dle experimentů uvedených v [6-7] jsou rychlejší než klasické lineární algoritmy [2-3]. Zajímavé bylo též prozkoumat chování algoritmu na datech, která vedou k dolnímu odhadu časové složitosti Omega(n^1.5).
References
[1] Dan Gusfield, Algorithms on Strings, Trees, and Sequences, Cambridge University Press, 1997.

[2] Edward M. McCreight, A Space-Economical Suffix Tree Construction Algorithm, Journal of the ACM 23 (2): 262-272, 1976

[3] Esko Ukkonen, On-line construction of suffix trees, Algorithmica 14 (3): 249-260, 1996

[4] Martin Senft, Compressed by the Suffix Tree, DCC 2006, 183-192.

[5] Martin Senft, T. Dvořák, On-line suffix treee construction with minimized branching, J. Discrete Algorithms, to appear.

[6] Y. Tian, S. Tata, R. A. Hankins, J. M. Patel, Practical methods for constructing suffix trees, VLDB Journal 14 (2005), 281-299.

[7] C-F. Cheung, J. X. Yu, H. Lu, Constructing Suffix Tree for Gigabyte Sequences with Megabyte Memory, IEEE Transactions on Knowledge and Data Engineering, 17 (2005), 90-105.
Preliminary scope of work
Implementace a experimentální analýza konstrukce sufixového stromu, založené na minimalizaci počtu větvících operací.
Preliminary scope of work in English
Implementation and experimental analysis of suffix tree construction with minimized branching.
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html