Thesis (Selection of subject)Thesis (Selection of subject)(version: 390)
Thesis details
   Login via CAS
Webový nástroj pre vizualizáciu sekundárnej štruktúry RNA
Thesis title in thesis language (Slovak): Webový nástroj pre vizualizáciu sekundárnej štruktúry RNA
Thesis title in Czech: Webový nástroj pro vizualizaci sekundární struktury RNA
Thesis title in English: Web-based tool for RNA secondary structure visualization
Key words: bioinformatika; RNA; skundární struktura; vizualizace
English key words: bioinformatics; RNA; secondary structure; visualization
Academic year of topic announcement: 2017/2018
Thesis type: Bachelor's thesis
Thesis language: slovenština
Department: Department of Software Engineering (32-KSI)
Supervisor: doc. RNDr. David Hoksza, Ph.D.
Author: hidden - assigned and confirmed by the Study Dept.
Date of registration: 08.10.2017
Date of assignment: 08.10.2017
Confirmed by Study dept. on: 22.11.2017
Date and time of defence: 06.09.2018 09:00
Date of electronic submission:03.07.2018
Date of submission of printed version:20.07.2018
Date of proceeded defence: 06.09.2018
Opponents: Mgr. Petr Škoda, Ph.D.
 
 
 
Guidelines
Vizualizace sekundární struktury RNA, tj. nalezení vhodného rozložení (layout) nukleotidů v 2D prostoru, je stále otevřený problém. To platí zvláště v případě velkých struktur obsahujících stovky nukleotidů, kde de novo metody selhávají. Alternativní přístup je proto vizualizovat strukturu za pomoci dostatečně spřížněné struktury RNA, pro kterou je již layout k dispozici. Příkladem takového přístupu je nástroj Traveler, vyvinutý na KSI MFF UK, který používá stromovou editační vzdáenost pro identifikaci konzervovaných částí struktur a nalezení předpisu jak transformovat vzorový layout na cílový. Traveler má ovšem problémy, které znemožňují jeho použití v některých situacích a navíc je přístupný pouze z příkazové řádky. Cílem bakalářské práce je proto vylepšení samotného algoritmu a vyvinutí webové aplikace, která autoamticky zvolí vhodný vzor, provede layout struktury a výsledek vizualizuje. Vylepšení algoritmu bude spočívat především v řešení problému, kdy podstruktury, které jsou lokálně podobné na sebe nejsou namapované, protože stromová editační vzdálenost volí taková mapování, které globálně minimalizuje vzdálenost. Další vylepčení budou spočívat v implementaci podpory kreslení vnořených motivů, které nejsou obsaženy ve vzorovém layoutu, implementaci meziformátu umožňujícího uživatelsky definovat paraser pro grafický formát vzorového layoutu a možnost zpracovávat pseudouzly.
References
[1] Richard Eliáš, David Hoksza. RNA secondary structure visualization using tree edit distance, International Journal of Bioscience, Biochemistry and Bioinformatics, 6(1), pp.: 9-17, International Academy Publishing, ISSN: 2010-3638, 2016
[2] Shihyen Chen, Kaizhong Zhang. An improved algorithm for tree edit distance with applications for RNA secondary structure comparison. Journal of Combinatorial Optimization, 27(4), pp. 778-797, 2012.
[3] Jones N.: An Introduction to Bioinformatics Algorithms, The MIT Press, 2004
[4] Liljas A., et al.: Textbook Of Structural Biology, World Scientific Publishing Company, 2009
Preliminary scope of work in English
RNA secondary structure visualization, i.e. finding a suitable layout of nucleotides in the 2D space, is still an open problem. That is especially true in case of large structures containing hundreds of nucleotides, where de-novo methods fail. An alternative approach is to visualize structures using sufficiently similar RNAs for which a layout is already available. An example of such approach is the Traveler tool, which was developed at the Department of Software Engineering, CU, and which utilizes the tree edit distance to identify conserved regions of the input structures to find a recipe of how to transform a template layout to the target one. However, Traveler has some issues which do not allow its use in some situations and it is, moreover, available from the command line only. The goal of the thesis is thus to improve the algorithm and to develop a web application which would automatically select a suitable template, carry out the layout algorithm and visualize the result. The algorithm improvement will rest mainly in solving the issue when locally similar substructures are not mapped onto each other because tree edit distance favors mappings which minimize the distance globally. Other improvements will cover support for laying out nested motifs, implementation of an intermediate format enabling implementation of user-defined parser of template layout graphics and the ability to handle pseudoknots.
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html