Poslední úprava: doc. Mgr. Milan Krtička, Ph.D. (20.09.2019)
Cílem přednášky je seznámit studenty se základními statistickými metodami používanými při analýze dat
experimentů ve fyzice vysokých energií. Důraz je kladen na praktickou stránku a aplikace probraných metod.
Součástí přednášky je i cvičení s demonstracemi implementace a příkladů použití za pomoci nástrojů Root, RooFit
a RooStat. Přednáška je vhodná zejména pro studenty doktorského programu a studenty druhého ročníku
navazujícího magisterského studia.
Poslední úprava: doc. Mgr. Milan Krtička, Ph.D. (20.09.2019)
The aim of the course is to introduce basic statistical methods frequently used in analysis of experimental data in
high energy physics. We focus mainly on practical aspects and application of the methods covered in the course.
Part of the lecture is an exercise session where implementation and usage examples are demonstrated using
Root, RooFit, and RooStat tools. The course is suited mainly for students of the doctoral programme or second-
year students of the master's programme.
Sylabus -
Poslední úprava: doc. Mgr. Milan Krtička, Ph.D. (20.09.2019)
Stručný úvod do matematické statistiky: pravděpodobnost, hustota pravděpodobnosti, kumulativní hustota pravděpodobnosti, momenty, MC metoda, propagace chyb, korelace, charakteristické funkce, příklady rozdělení pravděpodobnosti.
Odhad parametrů metodou maximální věrohodnosti (maximum likelihood): definice, variance M.L. odhadů (analytická metoda, MC metoda, applikace RCF nerovnosti, grafická metoda), případ pro více parametrů, M.L. kontury a jejich interpretace, M.L. metoda pro binovaná data, souvislost s metodou nejmenších čtverců, M.L. pro váhovaná data, extended likelihood, constrained likelihood, profile likelihood, příklady implementace v Rootu a RooFitu
Intervalový odhad parametrů: klasická teorie intervalů spolehlivosti, příklady pro normální, poissonovo a binomické rozdělení, interval spolehlivosti pro M.L. odhady, vícerozměrné intervaly spolehlivosti, interval spolehlivosti blízko hranice parametrického prostoru, Bayesovský přístup
Statistické testy: hypotéza, testovací statistika, úroveň spolehlivosti, Fisherův diskriminant, nelineární diskriminant (neuronové sítě, boosted decision tree, ...), separace signálu a pozadí, testování kvality fitu, implementace v ROOTu
Odhad limitů fyzikálních modelů: lokální p a p0 hodnota, signifikance, globální signifikance (look-elsewhere effect), CLs metoda, profiling, frekventistický vs. bayesovský přístup, prříklady implementace v RooFit a RooStat nástrojích
Dekonvoluce (unfolding): efekty detektorového rozlišení na data, migrační matice, inverze migrační matice a problémy této metody, regularizační metody, variance a bias dekonvoluovaných rozdělení, dekonvoluční techniky, příklady v Rootu
Systematické chyby: časté systematické nejistoty (škála kalibrace energetie a hybnosti, neurčitost v účinnosti a rozlišení), propagace systematických chyb, toy MC, bootstrap metoda
Poslední úprava: doc. Mgr. Milan Krtička, Ph.D. (20.09.2019)
brief introduction to mathematical statistics: probability, probability density function, cumulative probability function, moments, MC method, error propagation, correlation, characteristic function, examples of common probability density functions
Maximum likelihood parameter estimates: definition, variance of M.L. estimates (analytical method, MC method, RCF bound, graphical method), multi-parameter estimates, likelihood contours and their interpretation, binned M.L. method, relation with the least square method, M.L. for weighted data, extended likelihood, constrained likelihood, profile likelihood, examples in Root a RooFit
Confidence intervals of parameter estimators: classical confidence intervals, examples for gaussian, poisson and binomial distributions, confidence intervals for M.L. estimators, multi-dimensional confidence intervals, confidence intervals near parameter space boundary, Bayesian approach
Statistical tests: hypothesis, test statistics, confidence level, Fisher discriminant, non-linear discriminant (neural networks, boosted decision trees, ...), signal-background separation, goodness of fit, implementation in ROOT framework
Limit setting: local p a p0 values, significance, global significance (look-elsewhere effect), CLs method, profiling, frequentist vs. bayesian approach, examples of implementation in RooFit and RooStat
Unfolding: impact of a detector resolution on data, migration matrix, migration matrix inversion and problems of this method, regularization, variance and bias of the unfolded distributions, unfolding techniques, Root examples
Systematic uncertainties: common systematic uncertainties (energy and momentum scale, uncertainty in efficiency and resolution), systematic uncertainty propagation, toy MC, bootstrap method