Impact of a CE-Marked Medical Software Sensor on COVID- 19 Pandemic Progression Prediction: a Register Study Using Machine Learning Methods

Show full item record



Permalink

http://urn.fi/URN:NBN:fi:hulib-202204201730
Title: Impact of a CE-Marked Medical Software Sensor on COVID- 19 Pandemic Progression Prediction: a Register Study Using Machine Learning Methods
Alternative title: CE-merkityn lääketieteellisen ohjelmistosensorin vaikutus COVID-19 pandemian ennustamisessa: rekisteritutkimus käyttäen koneoppimismenetelmiä
Author: Limingoja, Leevi; Antila, Kari; Jormanainen, Vesa; Röntynen, Joel; Jägerroos, Vilma; Soinen, Leena; Nordlund, Hanna; Vepsäläinen, Kristian; Kaikkonen, Risto; Lallukka, Tea
Other contributor: Helsingin yliopisto, Lääketieteellinen tiedekunta
University of Helsinki, Faculty of Medicine
Helsingfors universitet, Medicinska fakulteten
Publisher: Helsingin yliopisto
Date: 2022
Language: eng
URI: http://urn.fi/URN:NBN:fi:hulib-202204201730
http://hdl.handle.net/10138/343625
Thesis level: master's thesis
Degree program: Lääketieteen koulutusohjelma
Degree Programme in Medicine
Utbildningsprogrammet i medicin
Specialisation: Suomenkielinen opintolinja
Study orientation in Finnish
Finskspråkig studieinriktning
Abstract: Tiivistelmä Johdanto: Ottaaksemme kantaa tämänhetkiseen COVID-19 pandemiaan, sekä muihin tuleviin pandemioihin, tarvitsemme robustia, reaaliaikaista ja populaatiotasoista datan keräystä ja analysointia. Nopea ja kattava populaatiotason tieto raportoitujen oireiden trendeistä tarjoaa aikaisemman katsauksen viruksen leviämisen etenemisessä ja auttaa ennustamaan terveydenhuollon tarvetta. Tavoite: Tutkimuksen tavoitteena oli käyttää CE-merkattua verkkopohjaista oirearviokyselyä, ©Omaoloa, ja validoida sen data kansallisen COVID-19 liittyviä potilaskontakteja vasten ja ennustaa pandemian etenemistä Suomessa. Menetelmät: Datamme koostui reaaliaikaisista ©Omaolon oirearviokyselyistä (414 477 kappaletta), sekä Terveyden ja hyvinvoinnin laitoksen hoitoilmoitusrekisteritiedoista, joka sisältää COVID-19 liittyvät päivittäiset hoitokontaktit. Data on 16.3.2020 – 15.6.2020 kattaen Suomen ensimmäisen pandemia-aallon. Oirearviokyselyt antavat käyttäjälleen lääketieteellisesti pätevän algoritmin pohjalta todennäköisyyden COVID- 19 taudista ja tarjoaa porrastetun ohjeistuksen siitä, kuinka toimia jatkossa. Koulutimme lineaariregressio ja XGBoost malleja yhdessä piirre-esivalintamenetelmien (F-pisteytys ja keskinäinen informaatio) kanssa ennustamaan hoitokontakteja aina viikko kerrallaan yhden viikon päähän. Tulokset: Mallimme ylsivät 24 % - 36.4 % prosentuaaliseen keskiarvovirheeseen (MAPE), kun ennustettiin kansallisesti päivittäisiä potilaskontakteja. Paras tulos saavutettiin yhdistämällä ©Omaolon ja aikaisempien hoitoilmoitusjärjestelmän tiedot yhteen. Paras ennuste saavutettiin käyttämällä lineaariregressiota ja keskinäistä informaatiota piirre-esivalintamenetelmänä. Johtopäätökset: Tarkkoja ennustuksia COVID-19 liittyvistä hoitokontakteista on mahdollista tehdä hyödyntämällä sekä ©Omaolon oirearviokyselyjä, että kansallisia hoitoilmoitusrekisteritietoja. Täten voidaan todeta, oirearviokyselyjä on mahdollista käyttää pandemian ennustamiseen, ja siten terveydenhuollon kuormituksen ennustamiseen myös tulevissa pandemioissa.Abstract Background: To address the current COVID-19 and any future pandemic, we need a robust, real-time, and population-scale collection and analysis of data. Rapid and comprehensive knowledge on the trends in reported symptoms in populations provides an earlier window into the progression of the viral spread and helps to predict the needs and timing of professional healthcare. Objective: The objective of this study was to use a CE-marked medical online symptom checker service, ©Omaolo, and validate the data against the national demand for COVID- 19-related care to predict the pandemic progression in Finland. Methods: Our data comprised real-time ©Omaolo COVID-19 symptom checker responses (414,477 in total) and daily admission counts in nationwide inpatient and outpatient registers provided by the Finnish Institute for Health and Welfare (THL) from March 16th to June 15th, 2020 (the first wave of the pandemic in Finland). The symptom checker responses provide self-triage information input to a medically qualified algorithm that produces a personalised probability of having COVID-19, and provides graded recommendations for further actions. We trained linear regression and XGBoost models together with F-score and mutual information feature pre-selectors to predict the admissions once a week, one week in advance. Results: Our models reached a MAPE (mean absolute percentage error) between 24.2% and 36.4% in predicting the national daily patient admissions. The best result was achieved by combining both ©Omaolo and historical patient admission counts. Our best predictor was linear regression with mutual information as the feature pre-selector. Conclusions: Accurate short-term predictions of COVID-19 patient admissions can be made, and both the symptom check questionnaires and the daily admissions data contribute to the accuracy of the predictions. Thus, symptom checkers can be used to estimate the progression of the pandemic, which can be considered when predicting the healthcare burden in a future pandemic.
Subject: COVID-19
koneoppiminen
regressioanalyysi
pandemiat


Files in this item

Total number of downloads: Loading...

Files Size Format View
Limingoja_Leevi_tutkielma_2022.pdf 538.5Kb PDF View/Open

This item appears in the following Collection(s)

Show full item record