PředmětyPředměty(verze: 945)
Předmět, akademický rok 2023/2024
   Přihlásit přes CAS
Základy biostatistiky a metodologie vědecké práce - CRHB003P2
Anglický název: Basic Biostatistics and Methodology of Scientific and Scholarly Work
Zajišťuje: Ústav lékařské biofyziky a lékařské informatiky 3. LF UK (12-ULBI)
Fakulta: 3. lékařská fakulta
Platnost: od 2016
Semestr: letní
Body: 2
E-Kredity: 2
Způsob provedení zkoušky: letní s.:
Rozsah, examinace: letní s.:20/10, Z [HS]
Počet míst: neurčen / neurčen (neurčen)
Minimální obsazenost: neomezen
4EU+: ne
Virtuální mobilita / počet míst pro virtuální mobilitu: ne
Kompetence:  
Stav předmětu: vyučován
Jazyk výuky: čeština
Způsob výuky: prezenční
Způsob výuky: prezenční
Úroveň:  
Garant: doc. Ing. Jana Vránová, CSc.
Termíny zkoušek   Rozvrh   
Anotace
Poslední úprava: doc. Ing. Jana Vránová, CSc. (02.12.2019)
Předmět je zaměřen na metody statistické analýzy určené především pro lékařský výzkum – klinické, biologické, biochemické, biofyzikální a jiné studie. Student se postupně seznámí s metodami deskriptivní a induktivní statistiky i se statistickými epidemiologickými metodami. Výuka začíná od základní statistické metodologie, přes jednodušší statistické metody – testování hypotéz, porovnání skupin (parametrické i neparametrické metody), t-testy, ANOVA, korelace a jednoduchá regresní analýza. Dále se student seznámí se složitými mnohorozměrnými metodami, jako jsou mnohorozměrné regresní modely, mnohorozměrné lineární modely, logistická regrese, diskriminační analýza, analýza přežití apod. Zvládnutí výpočtu těchto modelů a interpretace výsledků bude součástí praktických cvičení, a to jak v prostředí MS Excel tak v prostředí profesionálního statistického programu Statistica.
Cíl předmětu
Poslední úprava: doc. Ing. Jana Vránová, CSc. (02.12.2019)

Cílem předmětu je seznámit studenty se všemi základními statistickými metodami, které jsou dnes nejčastěji používány při statistickém vyhodnocení klinických studií, dotazníkových šetření a jiných vědeckých projektů a které jsou nezbytné při psaní vědeckých článků, vědeckých prací apod. Cílem je také naučit studenty orientovat se v prostředí profesionálních statistických programů.

Podmínky zakončení předmětu
Poslední úprava: doc. Ing. Jana Vránová, CSc. (02.12.2019)

80 %-ní účast na přednáškách, seminářích i cvičeních; zápočtový test

Literatura
Poslední úprava: doc. Ing. Jana Vránová, CSc. (02.12.2019)

Literatura a studijní pomůcky:

  1. M. Meloun, J. Militký: Statistická analýza experimentálních dat
  2. Zvárová J. a kol.: Základy informatiky pro biomedicínu a zdravotnictví [online], EuroMISE Centrum 2006, http://www.euromise.cz/education/textbooks/biomedicinska_informatika.html
  3. Richard F. Mould: Cancer Statistics, Adam Hilger Ltd., London, 1983
  4. Hendl, J.: Přehled statistických metod zpracování dat. Portál, Praha, 2004. ISBN 80-7178-820-1

Další doporučená literatura:

1.       Everitt B.S.: An R and S-PLUS® companion to multivariate analysis.

2.       (Springer texts in statistics), Springer-Verlag London Limited, 2005, ISBN 1-85233-882-2

3.       Abdelmonem Afifi; Virginia A. Clark; Susanne May: Computer-Aided Multivariate Analysis, Fourth Edition, Chapman & Hall/CRC Texts in Statistical Science Series, Issue No. 62, Chapman & Hall/CRC, 2003, ISBN 978-1-58488-308-1

4.       Douglas G. Altman: Practical Statistics for Medical Research, Chapman & Hall, London, 1995

5.       P. Armitage, G. Berry: Statistical Methods in Medical Research, Blackwell Scientific Publications, Oxford, London, 1994

Metody výuky
Poslední úprava: doc. Ing. Jana Vránová, CSc. (02.12.2019)

Přednášky, semináře, praktická cvičení

Požadavky ke zkoušce
Poslední úprava: doc. Ing. Jana Vránová, CSc. (02.12.2019)

80 %-ní účast na přednáškách, seminářích i praktických cvičeních; zápočtový test

Sylabus
Poslední úprava: doc. Ing. Jana Vránová, CSc. (02.12.2019)

Osnova přednášek:

  1. Statistické postupy v medicíně
  2. Deskriptivní statistika I
  3. Deskriptivní statistika II
  4. Testování hypotéz – 2 skupiny
  5. Analýza rozptylu při jednoduchém třídění
  6. Kontingenční tabulky
  7. Korelace a jednoduchá a mnohorozměrná regrese
  8. Logistická regrese
  9. ROC analýza a analýza přínosů a nákladů
  10. Analýza přežití
  11. Analýza hlavních komponent - PCA

1. Statistické postupy v medicíně:

Student se obeznámí se důvody použití statistických metod v medicíně, seznámí se základní strukturou tvorby, plnění cílů klinických a jiných vědeckých projektů, s tvorbou vědeckých publikací  a přednášek.

2. a 3. Deskriptivní statistické metody I a II

Struktura:

  1. Absolutní četnosti
  2. Relativní četnosti
  3. Míry polohy a variability
  4. Pravděpodobnost a různá pravděpodobnostní rozložení

Studenti se seznámí s absolutními a relativními četnostmi a jejich dělením, stejně tak budou umět absolutní a relativní četnosti správně použít. Studenti budou schopni spočítat základní statistické parametry souboru - aritmetický průměr, medián, modus, směrodatnou odchylku, rozptyl, rozpětí atd. Studenti se naučí tyto parametry a četnosti spočítat v prostředí MS Excel a v programu STATISTICA. Studenti budou schopni spočítat základní statistické parametry souboru - aritmetický průměr, medián, modus, směrodatnou odchylku, rozptyl, rozpětí atd.

4. Testování hypotéz

Struktura:

  1. úlohy o populacích, 
  2. nulová a alternativní hypotéza, 
  3. chyba I. a II. druhu, 
  4. interval spolehlivosti, 
  5. jednostranné a dvoustranné testy, 
  6. 2 nezávislé výběry, 
  7. párový test, 
  8. neparametrické testy

Studenti budou umět spočítat t-testy, Mann-Whitneyho U-test, a to jak v prostředí MS Excel, tak v programu STATISTICA.

Studenti se seznámí se základy testování hypotéz, a to konkrétně 

  • s testováním hypotéz o parametrech jednoho souboru - hypotézy o rozložení a hypotézy o poloze 
  • s testováním hypotéz 2 souborů - hypotézy a poloze a hypotézy o rozptylu

Také se naučí, kdy použít parametrický a kdy neparametrický test

5. Analýza rozptylu při jednoduchém třídění

Struktura

  1. testování hypotéz pro tři a více skupin
  2. postup analýzy rozptylu
  3. podmínky použití analýzy rozptylu
  4. metody následného mnohonásobného porovnávání
  5. parametrické a neparametrické testy

Studenti budou umět spočítat ANOVU i Kruskal-Wallisovu ANOVU i testy následného mnohonásobného porovnávání, a to jak v prostředí MS Excel, tak v programu STATISTICA. 

Studenti se seznámí se statistickou metodou pro nalezení statisticky významného rozdílu ve sledovaných veličinách v případě  tří a více skupin pacientů. Budou rozumět důvodu, proč je nutno použít pro nalezení rozdílu mezi jednotlivými páry skupin pacientů testy následného mnohonásobného porovnávání, a to metodami LSD, pomocí Bonferroniho a Scheffeho testu. Budou vědět, kdy je možno použít klasickou ANOVU a kdy je nutné použít neparametrický Kruskal-Wallisův test.

6. Kontingenční tabulky

Struktura:

  1. vztah kvalitativních a diskrétních proměnných
  2. tabulky 2 x 2
  3. tabulky r x s
  4. hypotéza homogenity
  5. hypotéza nezávislosti
  6. Pearsonův chí-kvadrát test
  7. Fisherův exaktní test   

Studenti budou znát základní použití kontingenčních tabulek, které vznikají při zkoumání diskrétních nebo kvalitativních znaků. Pokud bychom chtěli pomocí kontingenčních tabulek analyzovat spojité proměnné, převádíme je nejčastěji na intervalové proměnné, kdy intervaly představují zvolený libovolný počet kategorií pro danou proměnnou. Kontingenční tabulky jsou analogií s korelační analýzou v případech, kdy tuto nemůžeme použít. Studenti budou umět interpretovat výsledky kontingenčních tabulek, budou vědět, kdy je potřeba použít Fisherův exaktní test, kdy jej můžeme použít.

7. Korelace a jednoduchá regrese

Struktura:

  1. vztah dvou veličin
  2. Pearsonův a Spearmanův korelační koeficient
  3. rozdíl mezi regresí a korelací
  4. Kendallův korelační koeficient
  5. parciální korelační koeficient - zdánlivá asociaice

Student se seznámí s tím, že korelační analýza slouží k nalezení a poznání statistických závislostí dvou a více proměnných a k matematickému popisu těchto vztahů a také slouží k ověření a testování různých deduktivně učiněných teorií právě o tomto zkoumaném vzájemném vztahu. Cílem tohoto zkoumání je vniknutí do podstaty sledovaných jevů a procesů určité oblasti a tím i přiblížení k tzv. příčinným (kauzálním) souvislostem. 

Přesto, že hlavním cílem korelační analýzy je kvantifikovat intenzitu vzájemného vztahu dvou nebo vícero proměnných, důležitou roli hraje i kvalitativní rozbor příslušného souboru dat. Nemá smysl hledat a měřit závislost tam, kde na základě logické úvahy nemůže existovat, nebo je nesmyslná.

V regresní analýze se seznámí i s reziduální analýzou, která slouží k ověření statistické významnosti regresního modelu i k potvrzení, že námi vytvořený model je vhodný pro predikci. 

8. Logistická regrese

Struktura:

  1. definice
  2. binární, ordinální a nominální logistický model
  3. pravděpodobnost, šance, logit
  4. kvalita a statistická významnost logistického modelu
  5. klasifikační schopnost modelu    

9. ROC analýza a anlýzá náklafů a přínosů

Struktura:

  1. základní parametry ROC analýzy: sensitivita, specificita, pozitivní a negativní prediktivní hodnota
  2. přesnost diagnostického testu
  3. plocha pod ROC křivkou a interpretace její velikosti
  4. prahový bod – přísný, optimální nedbalý
  5. optimální určení prahového bodu pomocí analýzy přínosů a nákladů

ROC křivka (Receiver Operating Characteristic curve = graf prahové operační charakteristiky) byla vyvinuta americkými vědci a poprvé použita během 2. světové války pro přesnější detekci nepřátelských objektů. Je součásti teorie detekce signálů. Dnes nachází široké uplatnění především v oblasti medicíny při lékařském rozhodování, např. v epidemiologii, radiologii, psychologii apod. V posledních letech se ROC analýza stala důležitým nástrojem v oblasti strojového učení pro vyhodnocování a porovnávání kvality algoritmů neuronových sítí a metody vytěžování dat (data mining).

V oblasti medicíny se užívá především pro hodnocení kvality a síly diskriminace diagnostických, či screeningových testů, regresních a diskriminačních modelů, při zavádění nových diagnostických přístrojů, nových léků a nových způsobů léčby do medicínské praxe a také při porovnávání více diagnostických metod za účelem vybrat tu nejlepší, při porovnávání různých analytických modelů apod. Její neoddělitelnou součásti se dnes stala analýza nákladů a přínosů (Cost – Benefit Analysis).

10. Analýza přežití 

Struktura:

  1. cenzorovaná a necenzorovaná proměnná
  2. úmrtnostní tabulky
  3. Kaplan-Meierova metoda
  4. Coxova regrese s proporcionálním rizikem

11. Analýza hlavních komponent - PCA

Struktura:

  1. určení struktury ve znacích a objektech
  2. definice PCA, hlavní komponenty, rozptyl, snížení dimenze úlohy
  3. transformace původních znaků do menšího počtu latentních proměnných
  4. grafické nástroje PCA
  5. diagnostika metody PCA 

Nejstarší a nejvíce používaná metoda vícerozměrné analýzy dat – 1901 (Pearson), nezávisle na něm v 1933 Hotelling. Znaky nejsou děleny na závisle a nezávisle proměnné. Metoda lineární transformace původních znaků na nové, nekorelované proměnné – hlavní komponenty. Základní charakteristikou hlavní komponenty – rozptyl. Většina informace o variabilitě původních dat je soustředěna v první komponentě, nejméně informace je soustředěno v poslední. Standardním využitím PCA je snížení dimenze úlohy bez velké ztráty informace. Hlavní komponenty jsou nekorelované

Vstupní požadavky
Poslední úprava: doc. Ing. Jana Vránová, CSc. (02.12.2019)

znalosti středoškolské matematiky

Podmínky zakončení předmětu
Poslední úprava: doc. Ing. Jana Vránová, CSc. (02.12.2019)

80 %-ní účast na přednáškách, seminářích i cvičeních; zápočtový test

 
Univerzita Karlova | Informační systém UK