Last update: prof. RNDr. Jitka Rychtaříková, CSc. (15.02.2016)
The course introduses students to the SAS software with lot of practical examples. In addition, selected procedures from SAS/STAT software are taught in order to use multidimensional statistics in demography.
Last update: prof. RNDr. Jitka Rychtaříková, CSc. (15.02.2016)
Cílem kursu je rozšíření možností produktu SAS, a to jak v přípravě práce s daty, tak s jejich následnou (vícerozměrnou) analýzou, zejména při demografickém studiu.
Literature - Czech
Last update: prof. RNDr. Jitka Rychtaříková, CSc. (15.02.2016)
Texty obsažené v adresářích v:\Rychtarikova\SASII.
Requirements to the exam - Czech
Last update: prof. RNDr. Jitka Rychtaříková, CSc. (15.02.2016)
Forma zkoušky písemná. Předpokladem je absolvování závěrečného písemného testu (sestavení programu)a aktivní účast na výuce.
Syllabus -
Last update: prof. RNDr. Jitka Rychtaříková, CSc. (15.02.2016)
1. STDRATE Procedure. Directly standardized rates and risks for study populations. For homogeneous effects across strata Mantel-Haenszel estimates. Summary statistics, such as rate and risk estimates and their confidence limits, in each stratum. Attributable Fraction and Population Attributable fraction with Indirect Standardization with with Mantel-Haenszel Estimation. In addition, stratum-specific statistics by using ODS Graphics.
2. Selected SAS/GRAPH procedures: The GPLOT procedure for creating line plots, scatters, histograms, area plots, etc. Different types of scatter plots, also in panels and with different layouts: the GBARLINE procedure. GCHART procedure for making a block chart, horizontal and vertical bar charts, pie and donut charts, and star chart. GCONTOUR procedure enables two-dimensional plots representing three-dimensional relationships.
3. The LIFETEST procedure computes nonparametric estimates of the survivor functions, compares survival curves, and computes rank tests for association of the failure time variable with covariates. Nonparametric estimates of the survivor function are computed either by the product-limit method (also called the Kaplan-Meier method) or by the life-table method (also called the actuarial method). The survival distribution function (SDF), the cumulative distribution function (CDF), the probability density function (PDF), and the hazard function, including standard errors, are estimated.
4. The LIFEREG procedure fits parametric models to failure time data that can be uncensored, right censored, left censored, or interval censored. The exponential, Weibull, lognormal, and other distributions are supported. The models are equivalent to accelerated failure time models when the log of the response is the quantity being modeled. The effect of independent variables on an event time distribution is multiplicative. The estimates of parameters are made by maximum likelihood method.
5. The PHREG procedure performs regression analysis of survival data based on the Cox proportional hazards model known as multiplicative hazard model. Cox's model is used in the analysis of survival data to explain the effect of explanatory variables (including time-dependent variables) on hazard rates. The Cox proportional hazards model (semi-parametric) makes the assumption that the hazards for patient subgroups are proportional to the baseline hazard. Cox model is fitted by maximizing the partial likelihood. The CLASS statement enables the classification variables to be used, in addition to continuous variables, as explanatory variables in the analysis.
6. The QUANTLIFE procedure performs quantile regression analysis for survival data. Regression analysis that explores how the conditional quantile of a response variable depends on its covariates.
7. The LOGISTIC procedure fits logistic models, in which the response can be binary or ordinal or nominal. Logistic regression analysis is used to investigate the relationship between these discrete responses and a set of explanatory variables that can be continuous or categorical. Link function is logit function. The model is fitted by the method of maximum likelihood. Odds ratios are displayed along with parameter estimates.
Last update: prof. RNDr. Jitka Rychtaříková, CSc. (15.02.2016)
The STDRATE procedure. Metody standardizace: přímá, nepřímá a Mantel-Haenszel. Výpočet Atributivní frakce a Populační atributivní frakce. Intervaly spolehlivosti a testování významnosti rozdílů. Míry a rizika.
PLOT procedure; SAS/GRAPH: Tvorba x,y a dalších grafů v grafickém režimu, Popis grafů os, volba typu čar, barev, ap. GPLOT procedure (dvouroměrné grafy, korelační diagramy, 1-2 osy y). GCHART procedure GBARLINE procedure(sloupcové grafy, četnosti, kumulativní četnosti, sloupcové a čárové grafy, ap.) GCONTOUR (trojrozměrné grafy, konturové mapy).
LIFETEST procedure (Survival analysis - analýza přežití). Neparametrické odhady délky přežití. Kaplan-Meierova metoda a aktuárská (úmrtnostní) tabulka. Cenzorování. Funkce SDF, CDF a PDF. Volba délky intervalů času, testování odlišnosti křivek. Kreslení grafů tabulkových funkcí. Agregovaná a individuální data.
LIFEREG procedure. Parametrické odhady délky přežití. Metody odhadu parametrů. Exponenciální a Weibullovo rozdělení. Porovnání parametrického modelu s neparametrickým řešením. Agregovaná a individuální data.
PHREG procedure. Semiparametrické modelování. Coxova regrese. Odhady vlivu proměnných (numerické i nominální) na délku přežití.Transformace nominálních proměnných na designové proměnné (designová matice). Proporcionální rizika. Testování významnosti proměnných a jednotlivých kategorií mezi sebou. Metody výběru proměnných. Agregovaná a individuální data.
The QUANTLIFE Procedure. Kvantilová regrese (např. data obsahují extrémní pozorování) odhaduje podmíněné kvantily závislé proměnné v závislosti na hodnotách nezávislé proměnných. (Metoda nejmenších čtverců minimalizuje součet druhých mocnin reziduí, kvantilová regrese minimalizuje součet absolutních hodnot reziduí.). Numerické i nominální proměnné, cenzorování. Agregovaná a individuální data.
LOGISTIC procedure. Binární logistická regrese. Ordinální logistická regrese. Multinomická logistická regrese. Link funkce. Pravděpodobnost, šance, poměr šancí. Transformace nominálních proměnných na designové proměnné (designová matice). Testování významnosti proměnných a rozdílů mezi kategoriemi. Testování vhodnosti kumulativního logitového modelu. Metody výběru proměnných. Agregovaná a individuální data.