Thesis (Selection of subject)Thesis (Selection of subject)(version: 368)
Thesis details
   Login via CAS
Indel calling from NGS data
Thesis title in Czech: Určování inzercí a delecí z NGS dat
Thesis title in English: Indel calling from NGS data
Key words: inzerce delece NGS
English key words: indels variant calling truth-set NGS
Academic year of topic announcement: 2022/2023
Thesis type: diploma thesis
Thesis language: angličtina
Department: Department of Cell Biology (31-151)
Supervisor: Mgr. Petr Daněček, Ph.D.
Author: hidden - assigned and confirmed by the Study Dept.
Date of registration: 19.12.2022
Date of assignment: 29.12.2022
Confirmed by Study dept. on: 02.03.2023
Preliminary scope of work
Určování inzercí a delecí z NGS dat je složitý problém. Existující algoritmy mají relativně nízkou spolehlivost a vykazují mezi sebou velké rozdíly. Ty jsou způsobené jak sekvenačními chybami a chybami mapování, tak nejednoznačností při zarovnávání sekvencí. Cílem práce je srovnat rozdíly mezi vybranými metodami a klasifikace problematických indelů. Užitečným výstupem práce může být truth set vhodný pro automatizované testování a trénink algoritmů umělé inteligence.
Preliminary scope of work in English
Indel calling from NGS data is a difficult problem. Due to sequencing and mapping errors, as well as inherent alignment ambiguities, existing algorithms have low reproducibility rates. The aim of this project is to benchmark selected indel calling algorithms and classify problematic indel types. The desired outcome of the project will be a curated truth set suitable for automated test suites and machine learning algorithms.
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html