Thesis (Selection of subject)Thesis (Selection of subject)(version: 368)
Thesis details
   Login via CAS
Metoda maximální věrohodnosti ve fyzice vysokých energií
Thesis title in Czech: Metoda maximální věrohodnosti ve fyzice vysokých energií
Thesis title in English: Method of maximum likelihood in high energy physics
Key words: metoda maximální věrohodnosti|fyzika vysokých energií|PyHF|HistFaktory|template fit|Higgsův boson
English key words: method of maximum likelihood|high energy physics|PyHF|HistFaktory|template fit|Higgs boson
Academic year of topic announcement: 2024/2025
Thesis type: Bachelor's thesis
Thesis language:
Department: Institute of Particle and Nuclear Physics (32-UCJF)
Supervisor: Mgr. Daniel Scheirich, Ph.D.
Author:
Guidelines
Student se seznámí s metodou maximální věrohodnosti a její konkrétní formou pro binovaná data (tzv. template fit), který se často používá k analýze dat v částicové fyzice. Na reálných datech z experimentu ATLAS na LHC (rozpady Higgsova bosonu) provede jednoduchou analýzu a pokusí se implementovat metodu pro odhad neurčitosti fitovaných parametrů. Student bude pracovat s moderním analyzačním softrwarem PyHF, který je implementován v jazyce Python. Práce bude spočívat především v programování a statistické analýze dat. Zálkadní znalost programování je výhodou.
References
Statistical data analysis, G. Cowan. Oxford University Press, USA, (1998)
T. Davídek, R. Leitner: Elementární částice od prvních objevů po současné experimenty, Matfyzpress 2012
PyHF documentation: https://pyhf.readthedocs.io/en/v0.6.2/intro.html
Statistical methods in HEP: https://ipnp.cz/?page_id=4280
Preliminary scope of work
Děje v kvantovém světe jsou ze své podstaty náhodné. Jedna srážka protonů v urychlovači nám toho tedy o mikrosvětě mnoho nepoví. Pokud se ale stejný experiment opakuje mnohokrát, začínají se v datech objevovat statistické zákonitosti, které dokážeme modelovat a srovnávat s předpovědí našich fyzikálních teorií. Jedním ze základních koceptů, který nám umožnuje uchopit náhodná data je histogram: graf závislosti četnosti pozorovaných případů na nějaké měřené fyzikální veličině (energii, hmtotnosti, rozpadovém úhlu, ...). Jedná se tedy vlastně o určitou aproximaci hustoty pravděpodobnosti náhodné veličiny zkonstruovanou z dat. Metoda maximální věrohodnosti je jednou z hojně používaných metod, která nám umožňuje určit (nafitovat) neznámé parametry těchto rozdělení a srovnat je s teoretickou předpovědí. Například tak můžeme určit s jakou pravděpodobností se v našich datech vyskytuje Higgsův boson (neboli změřit jeho účinný průřez), což je veličina velmi dobře předpovězená tzv. Standardním modelem (veleúspěšnou teorií popisující děje v mikrosvětě) a ověřit tak jeho platnost.
Částicoví fyzikové pouzívají pro fitování histogramů dlouhá léta nástroj zvaný HistFaktory, který je implementován v jazyce c++. V poslední době se na scéně objevila nová verze tohoto oblíbeného nástroje zvaná PyHF, která je napsaná čistě v oblíbeném jazyce Python. Zatímco PyHF se jeví jako slibný pokračovatel dobře etablované HistFactory využívající nejmodernější vedecké knihovny v Pythonu, některé funkce v ní stále chybí. Jednou z nich je podpora odhadu neurčitosti fitovaných parametrů pomocí tzv. grafické metody. Cílem tohoto bakalářského projektu je důkladně seznámit studenta s metodou maximální věrohodnosti. Student potom využije tyto teoretické znalosti k implementaci grafické metody odhadů neurčitosti parametrů pro nástroj PyHF. Student bude pracovat s reálnými daty z experimentu ATLAS na LHC, konkrétně s daty obsahujícími rozpad Higgsova bosonu na pár tau leptonů.
Preliminary scope of work in English
Processes in quantum world are by their very nature random. This means that observing one collision of particles in a collider does not tell us much. However, if we repeat the experiment many times we will start to see statistical trends in our data that can be modelled and compared with theoretical predictions. One of the basic concepts that allows us to get a handle on random data is histogram: a graph of an observed event rate as a function of some measured quantity (energy, mass, decay angle, ...). In an essence it is an approximation of a probability density function of a random variable constructed from data. The method of maximum likelihood is one of the well used methods that allows to extract (fit) unknown parameters of these probability densities and compare them with theoretical predictions. For example, one can determine the probability of having a Higgs boson in one's data (i.e. measure its cross section), which is a quantity very well predicted by the so called Standard model (a super successful theory of particle physics) and thus test its validity.
For many years, particle physicists use a tool called HistFactory to fit histograms. This tool is implemented in the c++ language. Recently, a new version of the tool called PyHF appeared, which is implemented purely in Python. While PyHF appears to be a promising continuator of the well established HistFactory using the modern scientific libraries of Python, there are still some features which are missing. One of them is support of the parameter uncertainty estimate using so called graphical method. Aim of this project is to familiarise the student with the ML method. She/he will then use this knowledge to implement graphical method in PyHF. Student will work with the real data from experiment ATLAS at the LHC containing decays of the Higgs boson to pairs of tau leptons.
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html