noun_Email_707352 noun_917542_cc Map point Play Untitled Retweet Group 3 Fill 1

TietoEVRY:n koronaepidemian ennustetarkkuus huippuluokkaa

Terveydenhuollon edistyneen pilvianalytiikan tiimi laati koronaviruksen leviämisestä skenaarioita tavoitteenaan realistinen ennuste epidemian kestosta ja tartuntojen määrästä.

04 kesäkuuta 2020

Tänä keväänä on erilaisten ennustemallien ja skenaarioiden rooli koronaviruksen aiheuttamassa epidemiassa herättänyt paljon keskustelua. Kun Suomen hallitus päätti poikkeusoloista maaliskuussa, ryhtyi TietoEVRY:n terveydenhuollon edistyneen pilvianalytiikan tiimi laatimaan aiheesta skenaarioita. Tavoitteena oli laatia realistinen ennuste epidemian kestosta ja tartuntojen määrästä.

Nyt maaliskuussa laadittujen skenaarioiden laatimisesta on kulunut reilu kaksi kuukautta, joten on hyvä hetki vertailla, miten eri skenaariot ja toteuma näyttäytyvät samassa kuvassa. Suomessa koronaepidemia on kehittynyt positiivisemmin kuin oletettiin.

 

covid-blog-image.png

Kuvassa ovat mukana seuraavat aikasarjat:

  1. TietoEVRY:n maaliskuun lopussa laatimat kolme ennustetta, jotka olivat yhtiön omassa ja pilvianalytiikka-asiakkaiden käytettävissä 1.4. alkaen.
  2. Suomen nykyisten tartuntojen kolme arviota: 2x (”Lower bound”), 5x (”Intermediate”) sekä 10x (”Upper bound”) määränä todetuista tartunnoista
    1. Tällä hetkellä ei tarkasti tiedetä, mikä on tartuntojen todellinen määrä, mutta on esitetty arvioita että määrä olisi noin 2-10x varmistettujen tartuntojen määrä.
  3. Suomen hallituksen Poikkeusolojen päätöksen 16.3.2020 muistiossa olevat kolme skenaariota ja Uudenmaan sulkemista koskevan päätöksen 25.3.2020 muistion kaksi skenaariota. Näissä ennusteissa on mukana poikkeuslain hidastamistoimien vaikutukset.

Kuvassa näemme miten TietoEVRY:n logaritmisella skaalalla kuvatut ennusteet seuraavat melko tarkasti nykyisiä arvioita tartuntojen yhteismäärästä.

Miten tarkka ennuste syntyi?

Warren Buffettia lainatakseni: tarkan ennusteen tekeminen on yksinkertaista, mutta se ei ole helppoa. Hyvän ennustetarkkuuden saavuttaminen pohjautuu harvoissa tilanteissa ylivertaiseen ennustemalliin.

Olennaista on ymmärtää tarkasti, mitkä oletukset ilmiön hahmottamisessa kestävät aikaa, ja pitääkö epävarmuuden hallitsemiseksi oletuksia vaihtaa ennustejakson aikana. Varsin tyypillinen syy heikkoon ennusteiden tarkkuuteen onkin se, että malliin syötetyt oletukset muuttuvat ennustejaksolla.

Suomen hallituksen muistion ennustemallien suureksi nousseet ennustevirheet eivät johdu itse epidemiamalleista, joita oli pitkin kevättä useita erilaisia. Poikkeama ennustettujen ja todettujen tartuntojen välillä johtuu nimenomaan oletuksista, jotka malliin syötettiin parametrien mukana. Käytännössä ihmisten käyttäytyminen muuttui enemmän kuin skenaarioissa oli oletettu.

Epidemioiden mallintamiseen on olemassa lukuisia valmiita malleja, ja voisi jopa puhua mallikirjastoista. Mikäli ei omaa pitkää kokemusta alalta tai koulutustaustaa epidemioiden mallintamisesta, olisi kyseenalaista yrittää kehittää omaa tapaa itse epidemian mallintamiseksi.

TietoEVRY päätyi käyttämään epidemian ensimmäiseen mallinnukseen yleisesti tunnettua melko yksinkertaisiin differentiaaliyhtälöihin perustuvaa SEIR-mallia. Koska malli sisältää "korkoa korolle" -tyyppisen eksponttifunktion, tulee tarkasti arvioida, kestävätkö tuon tarttuvuusluvun oletukset aikaa simulaatiojakson ajan. Samalla differentiaaliyhtälön kertoimet eivät ole enää vakioita.

Kestävätkö oletukset aikaa?

Varsinainen ennustetarkkuuden määrittävä tekijä ei tässä tapauksessa ole, käytetäänkö SEIR-mallia vai jotain muuta, vaan onnistutaanko kuvaamaan käytetyn mallin parametrit realistisesti ajan suhteen. Hyvän ennustetarkkuuden saavuttamiseksi olennaisin asia on saada oletukset kuvattua oikein, eli ennustettua mallin parametrit ajan suhteen.

Epidemiaskenaarioiden kohdalla tarkkuuden määritti käytännössä tarttuvuusluvun ennustaminen oikein ajan suhteen. Tarttuvuusluvun muutos on yhdistelmä monia asioita, kuten politiikkatoimien vaikutusta ja ihmisten käyttäytymisen muutosta. Molemmista oli tarjolla dataa sekä tieteellisinä julkaisuina että moninaisina tietolähteinä - alustayhtiöiden liikkuvuusdatan raporteista yksittäisiin laboratoriotuloksiin. Ennustetarkkuuden määritti se, miten hyvin tarttuvuusluvun uskottavimman arvion sai johdettua eri datalähteistä ja kuvattua Suomen epidemiamalliin.

Hallituksen ennusteissa oletettiin, että ihmiset vähentävät sosiaalisia kontaktejaan satojen päivien ennustejakson aikana kolmanneksen tai neljänneksen. TietoEVRY käytti moniulotteisempaa analyysiä tarttuvuusluvun määrittämiseen, missä piilee hyvän ennustetarkkuuden syy.

Olennaista ei siis ole mahdollisimman monimutkainen malli tai oletukset. Occamin partaveitsi suosittaa valitsemaan samaa ilmiötä selittävistä teorioista yksinkertaisimman. Suosittelen samaa lähestymistapaa ennusteiden laatimisessa: vaikka taustalla olisi syvällistä matematiikkaa, kannattaa pyrkiä kuvaamaan yksinkertaisten oletusten kautta tapaa hallita aikajakson epävarmuutta. Kun tehdyt oletukset saadaan kuvattua irrallisina ymmärrettävinä kokonaisuuksina, on lopputuloksen epävarmuuksista helppo keskustella ilman salatieteen tai mystiikan sävyä.

Lue lisää sosiaali- ja terveydenhuollon ratkaisuista

Haluatko tulla tekemään merkityksellisiä projekteja kanssamme? Katso avoimet työpaikkamme!

Haluatko kuulla lisää?

Tapio Pitkäranta

TietoEVRY alumn

Jaa Facebookissa Jaa Twitterissä Jaa LinkedInissä