Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 390)
Detail práce
   Přihlásit přes CAS
The small sample size problem in gene expression tasks
Název práce v češtině:
Název v anglickém jazyce: The small sample size problem in gene expression tasks
Akademický rok vypsání: 2013/2014
Typ práce: diplomová práce
Jazyk práce: angličtina
Ústav: Katedra biofyziky a fyzikální chemie (16-16110)
Vedoucí / školitel: doc. Dipl.-Math. Erik Jurjen Duintjer Tebbens, Ph.D.
Řešitel: skrytý - zadáno vedoucím/školitelem
Datum přihlášení: 31.10.2013
Datum zadání: 31.10.2013
Datum a čas obhajoby: 02.06.2015 00:00
Datum odevzdání elektronické podoby:15.05.2015
Datum proběhlé obhajoby: 02.06.2015
Oponenti: RNDr. Jan Kalina, Ph.D.
 
 
 
Zásady pro vypracování
Požadavky: dobrý vztah k matematice a algoritmizaci; schopnost studovat odborné texty v angličtině.
Seznam odborné literatury
L. Eldén: Matrix Methods in Data Mining and Pattern Recognition, Fundamentals of Algorithms 4, SIAM , 2007.

J. Duintjer Tebbens, I. Hnetynkova, M. Plesinger, Z. Strakos and P. Tichy: Analysis of Methods for Matrix Computations, Basic Methods (in Czech), Matfyzpress Prague, 2012.

J. Duintjer Tebbens, P. Schlesinger: Improving Implementation of Linear Discriminant Analysis for the High Dimension/Small Sample Size Problem, Computational Statistics and Data Analysis, 2007, vol. 52, no.1, s. 423-437.

P. Howland, M. Jeon, H. Park: Structure preserving dimension reduction for clustered text data based on the generalized singular value decomposition. SIAM J. Matrix Anal. Appl. 25 (2003), no. 1, 165–179.
Předběžná náplň práce
Moderní úlohy genové exprese vyžadují vyhodnocení velmi vysokeho počtu proměnných (alespoň v tisících), ale je pritom obtížné, nebo často i nemožné získat stejný počet vzorků. Tento tzv. problém maleho vyberu způsobuje to, ze prislusne numerické metody se stanou temer nepoužitelnymi. Matice budou singulární a některé potřebné vlastni vektory ani nelze správně definovat. Účelem práce je vytvořit nové nebo dále rozvíjet stávající strategie s cílem vyrovnat se s těmito problémy. Každé zlepšení je velmi žádoucí v této velmi aktivní oblasti výzkumu.
Předběžná náplň práce v anglickém jazyce
Modern gene expression tasks require the evaluation of a very high number of variables (at least in the thousands) whereas it is difficult or often impossible to gather the same number of samples. This so-called small sample size problem causes the underlying numerical methods to become hard to use. The involved matrices will be singular and some of the needed eigenvectors cannot even be defined properly. The purpose of the thesis is to develop new or to further develop existing strategies in order to cope with these difficulties. Any improvement is highly desirable in this very active area of research.
 
Univerzita Karlova | Informační systém UK