Deep Neural Network Classifiers in CMS Track Reconstruction and in the Search for the Charged Higgs Boson

Show full item record



Permalink

http://urn.fi/URN:ISBN:978-951-51-1300-9
Title: Deep Neural Network Classifiers in CMS Track Reconstruction and in the Search for the Charged Higgs Boson
Author: Havukainen, Joona
Contributor organization: University of Helsinki, Faculty of Science, Department of Physics
Doctoral Programme in Particle Physics and Universe Sciences
Helsinki Institute of Physics, CERN
Helsingin yliopisto, matemaattis-luonnontieteellinen tiedekunta
Alkeishiukkasfysiikan ja maailmankaikkeuden tutkimuksen tohtoriohjelma
Helsingfors universitet, matematisk-naturvetenskapliga fakulteten
Doktorandprogrammet i elementarpartikelfysik och kosmologi
Publisher: Helsingin yliopisto
Date: 2021-10-20
Language: eng
Belongs to series: HIP-Internal Report Series - URN:ISSN:1455-0563
URI: http://urn.fi/URN:ISBN:978-951-51-1300-9
http://hdl.handle.net/10138/334593
Thesis level: Doctoral dissertation (monograph)
Abstract: The LHC particle accelerator at CERN is probing the elementary building blocks of matter at energies never seen in laboratory conditions before. In the process of providing new insights in to the Standard Model describing the current understanding of physics governing the behaviour of particles, the accelerator is challenging the algorithms and techniques used in storing the collected data, rebuilding the collected collision events from the detector signal and analysing the data. For this end many state of the art methods are being developed by the scientist working in the LHC experiments in order to gain as much knowledge from the unique data collected from these particle collisions. The decade starting from 2010 can be in many respects considered as the deep learning revolution where a family of machine learning algorithms collectively called deep neural networks had significant breakthroughs driven by advances in hardware used to train these algorithms. During this period many achievements previously only seen in the realm of science fiction became reality as the deep neural networks began driving cars, images and videos could be enhanced with super resolution in real time and improvements in automated translation tools lowered the barriers in communication between people. These results have given the field of deep learning a significant momentum and lead to the methods spreading across academic disciplines as well as different industries. In this thesis the recent advances of deep learning are applied into the realm of particle physics using the data collected by the CMS experiment at the LHC at CERN. First topic presented considers the task of rebuilding the flight paths of charged particles called tracks inside the detector using the measurements made by the Tracker sub-detector in the heart of the CMS. The conditions present inside the detector during particle collisions demand for advanced algorithms able to be both fast and precise. The project in this thesis looks at estimating the quality of the reconstructed tracks and reject tracks that look like they are a result of mistakes made by the reconstruction algorithms, purifying the reconstructed dataset from false signals. Previously the task has been done initially by cut based selections determined by physicists and later by another machine learning algorithm known as the boosted decision tree. Here the first application of deep neural networks to the task is presented with the goal of both simplifying the upkeep of the classifier as well as improving the performance. In the second topic the application of deep neural network classifiers in the context of a search for a new particle, the charged Higgs boson, is presented. Here the main focus is in producing a classifier that has been decorrelated from a variable of interest that will be used in making the final discovery or exclusion of the hypothetical particle. The classifier can then be used just like any other selection step in the analysis aiming to separate known Standard Model background events from the expected signal without distorting the distribution for the variable of interest. Both research topics present first time use cases at the CMS for deep neural networks in their respective contexts and the work done includes the full stack of solving a machine learning problem, starting from data collection strategy to cleaning the data and working out the meaningful input variables for the problem all the way to training, optimizing and deploying the model to get the final results for their performance.Sveitsin ja Ranskan rajalle rakennettu Large Hadron Collider hiukkaskiihdytin törmäyttää atomien ytimistä löytyviä protoneita toisiinsa ennennäkemättömän suurilla energioilla. Nämä törmäyksissä syntyy uusia lyhytikäisiä hiukkasia, joita ei havaita tavanomaisissa olosuhteissa maapallolla. Havainnoimalla erilaisten hiukkasten tuottomääriä törmäyksissä, pystytään tekemään tarkkoja mittauksia fysiikan perusvuorovaikutuksista ja sitä kautta tutkimaan vastaako luonto kaikkein pienimmillä kokoluokilla ymmärrystämme. Hiukkastörmäykset tarjoavat ikkunan maailmankaikkeuden perusrakenneosasiin, alkeishiukkasiin, sekä niiden välisiin vuorovaikutuksiin, joiden teoreettinen kuvaus on kiteytetty hiukkasfysiikan standardimalliin. Hiukkastörmäysten tutkimus vaatii kehittyneiden mittalaitteiden lisäksi hienostuneita analyysimenetelmiä. Pohjimmiltaan hiukkaset ja niiden vuorovaikutukset tottelevat kvanttimekaniikan lainalaisuuksia, minkä takia tutkimus vaatii tilastollisten menetelmien soveltamista: suuresta määrästä dataa voidaan saada luotettavia tuloksia, kun taas yksittäisestä törmäyksestä ei voida vielä varmuudella sanoa mitä on tarkalleen tapahtunut. Perinteisten analyysimenetelmien lisäksi niin kutsutut koneoppimismenetelmät, joissa kerättyä dataa käytetään kouluttamaan algoritmi tekemään päätöksiä, ovat osoittautuneet hyödyllisiksi monenlaisissa käyttötarkoituksissa hiukkastörmäyksiä tutkiessa. Nämä samat koneoppimisalgoritmit ovat tulleet useille tutuiksi mediassa teköälyn nimikkeellä ja niitä voidaan käyttää monenlaisiin käyttökohteisiin kuten itseäänajavien autojen ohjaamiseen tai katsojaa mahdollisesti kiinnostavien elokuvien suositteluun videopalvelussa. Tässä väitöskirjassa tutkitaan kahta uutta käyttökohdetta syviä neuroverkkoja hyödyntäville koneoppimismenetelmille, joista ensimmäinen auttaa määrittämään törmäyksessä syntyneiden hiukkasten lentoratoja ja jälkimmäinen etsii törmäysdatasta merkkejä uudesta toistaiseksi havaitsemattomasta hiukkasesta. Molemmat tutkimukset liittyvät Compact Muon Solenoid mittalaitteen tuottamien havaintojen analysointiin ja kattavat koneoppimisongelman ratkaisemisen koko kaaren datan keräämisestä ja alustavasta siivoamisesta mielekkäiden muuttujien etsimiseen sekä lopulta algoritmin kouluttamiseen ja tuotantoon viemiseen.
Subject: kokeellinen hiukkasfysiikka
Rights: Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.


Files in this item

Total number of downloads: Loading...

Files Size Format View
havukainen_joona_dissertation_2021.pdf 25.92Mb PDF View/Open

This item appears in the following Collection(s)

Show full item record