Puheenvuoro 4.4.2024

Tekoälyllä parempia sääennusteita?

Tekoälyä hyödynnetään jo nyt sään ennustamisen eri vaiheissa. Tekoälyennusteiden valtti on niiden nopeus.
Kuva on luotu tekoälyn avulla.

Ilmatieteen laitos tuottaa reaaliaikaista tilannekuvaa sekä ennustetietoa sää-, meri-, ilmasto- ja avaruusolosuhteista ja niiden vaikutuksista. Fysikaaliset sää-, meri- ja ilmastomallit ovat keskeinen osa tätä olosuhteiden ennustearvoketjua. Tilastolliset menetelmät, mukaan lukien tekoäly, ovat jo pitkään olleet osa tätä ketjua. Tekoälyn avulla on pyritty tehostamaan esimerkiksi säähavaintojen käyttöä ennustemalleissa tai luomaan uusia vaikutusennusteita siten, että ne tunnistavat yhteydet meteorologisten ilmiöiden ja niiden vaikutusten välillä. 

Ilmakehää voi mallintaa jo nyt datapohjaisilla tekoälymalleilla. Esimerkiksi Euroopan keskipitkien sääennusteiden keskus ECMWF on kehittänyt prototyypin datapohjaisesta globaalista säämallista, joka ei perustu enää suoraan fysikaalisiin yhtälöihin. Sen sijaan se perustuu riippuvuuksiin, jotka tekoälymalli on oppinut perinteisellä säämallilla tuotetusta pitkästä data-aikasarjasta ilmakehän historiasta. 

Valmiiksi opetettu tekoälyennuste on huomattavasti nopeammin laskettavissa kuin supertietokonetta vaativa säämalliennuste.

Viime vuosina suuret teknologiayritykset ovat ottaneet edistysaskeleita datalähtöisten sääennustemenetelmien kehityksessä. Tekoälyennusteiden etu on niiden nopeus perinteisiin menetelmiin verrattuna: valmiiksi opetettu tekoälyennuste on huomattavasti nopeammin laskettavissa kuin supertietokonetta vaativa säämalliennuste. Laadultaan tekoälymallien sääennusteet ovat olleet muutaman parametrin osalta ja joillakin mittareilla mitattuna samaa tasoa kuin säämallien ennusteet – tai jopa parempia.   

Dataa on saatavilla paljon ja laskentateknologia on kehittynyt  

Mikä sitten on mahdollistanut datalähtöisten ennusteiden nopean kehityksen? Ensinnäkin dataa on nykyään paljon, ja se on helpommin saatavilla. Esimerkiksi eurooppalainen ilmastonmuutospalvelu Copernicus (C3S) tuottaa useiden vuosikymmenten ajalta säämalleihin ja havaintoihin perustuvaa globaalia uudelleenanalyysidataa, joka soveltuu hyvin tekoälymenetelmien opetusaineistoksi. Säähavainnot ja säämallien tuottama data ovat tekoälyennustearvoketjun tärkein polttoaine.  

Toiseksi tekoälymenetelmien opettamiseen hyvin soveltuva graafisiin kiihdyttimiin (GPU) perustuva laskentateknologia on yleistynyt.  

Tekoälyennusteissa on kuitenkin vielä puutteita ja kehityspotentiaalia. Rajuilmojen ja ukkosten kaltaisten äärisääilmiöiden ennustamiseen tarvittavaa, paikallisesti tarkkaa uudelleenanalyysidataa ei ole vielä saatavilla samassa laajuudessa kuin ”harvempaa” globaalidataa. Tekoälyennusteiden tuottama parametrien määrä on myös rajallinen säämallien tuottamiin ennusteisiin verrattuna. Uusien datalähteiden sisällyttäminen tekoälymenetelmien opettamiseen tulee olemaan keskeinen kehityskohde näiden molempien puutteiden parantamiseksi.  

Muuttaako tekoäly sääennusteiden tekoa? 

Tekoälyllä on potentiaalia nopeuttaa sääennusteiden tekemistä. Tekoäly voi myös mahdollistaa aivan uudella tavalla sään aiheuttamien vaikutusten, kuten energiantuotannon tai myrskyvaurioiden määrän, liittämisen kiinteäksi osaksi sääennustetta. Säähavainnoilla sekä paikalliseen tarkkuuteen kykenevillä säämalleilla, jotka ovat jo nyt operatiivisessa käytössä Ilmatieteen laitoksella, on todennäköisesti keskeinen rooli uuden opetusdatan tuottajana. Näiden lisäksi datalähtöisten ennustemenetelmien valtava nopeus houkuttelee tutkimaan, miten ennusteen epävarmuutta voisi arvioida datalähtöisillä menetelmillä kustannustehokkaammin nykyiseen parviennustetekniikkaan verrattuna. 

Tekoälymallit ja niiden laatu eivät kuitenkaan synny tyhjiöstä, vaan ne ovat juuri niin hyviä kuin menetelmien opetukseen käytetty data. Uudelleenanalyysidatoja ja niiden pohjalla olevia säämalleja pitää jatkossakin kehittää, jotta myös datapohjaisten ennustemenetelmien laatu kehittyy. Datojen luominen, päivittäminen ja tekoälyennustemenetelmien opettaminen on erittäin laskentaintensiivistä toimintaa, joka vaatii jatkossakin supertietokoneita.       

Tekoälymallit ja niiden laatu eivät synny tyhjiöstä, vaan ne ovat juuri niin hyviä kuin menetelmien opetukseen käytetty data.

On selvää, että tekoälyn tarjoamat uudet mahdollisuudet tulevat muuttamaan myös sääennusteiden tekoa, mutta menetelmien ja datan mahdollisuudet ja rajoitukset on ymmärrettävä. Tekoälymenetelmien ja niiden soveltamisen kehitysvauhti on juuri nyt hurjaa, joten on haastavaa arvioida, kuinka suuri murroksesta lopulta tulee.  

Ilmatieteen laitos on yhdessä eurooppalaisten kumppaniensa kanssa omalta osaltaan luomassa tätä murrosta kehittämällä ja testaamalla datalähtöisiä ennustemenetelmiä. Tällä hetkellä näyttää siltä, että parhaimmat tulokset saadaan yhdistämällä havainnot, fysikaaliset mallit ja tekoälymenetelmät tarkempien ja erityisesti nopeampien ennusteiden saavuttamiseksi. Investoinnit menetelmien tutkimukseen sekä data- ja laskentainfrastruktuuriin ovat välttämättömiä odotettujen hyötyjen saavuttamiseksi.

Sami Niemelä

Kirjoittaja on Meteorologian ja meritieteen tutkimusohjelman johtaja Ilmatieteen laitoksella.

Kuva: Veikko Somerpuro

TekoälySääennustePuheenvuoro