Kun supertietokone mallintaa maailmaa, kuva todellisuudesta tarkentuu

Simulaatiomalleilla voi tuottaa ennustuksia ilmiöistä, joita ei pystytä vielä tutkimaan kokeellisesti. Siitä on apua esimerkiksi sairauksien ennaltaehkäisyssä.

Juttu on julkaistu Yliopisto-lehdessä 9/2024. 

Kuuntele juttu Soundcloudissa tai Spotifyssa.

Solujen salat, ilmakehän ihmeet, molekyylien maailmat. Kaikki nämä aukenevat uudella tavalla, kun supertietokone pääsee raksuttamaan aineistoja ja mallintamaan niiden pohjalta todellisuutta.

Tietokoneiden laskentateho on kasvanut huimasti viime vuosikymmeninä. Se mullistaa tieteentekoa monella alalla. 

Uusia tutkimusmahdollisuuksia avautuu ja vanhojakin havaintoja ymmärretään paremmin. Simulaatiomalleilla voidaan myös tuottaa ennustuksia ilmiöistä, joita ei voida vielä tutkia kokeellisesti. 

— Laskennallisella tieteellä pääsee resoluutioon, johon ei mikroskooppikuva yllä. Voi nähdä, miten ja miksi molekyylit tarttuvat toisiinsa, kertoo biologisen fysiikan professori Ilpo Vattulainen.

Kun tiedetään, miten mikäkin atomi on vuorovaikutuksessa toistensa kanssa, voidaan kytkeä vuorovaikutukset päälle ja laskea ne kaikille atomeille, satoja miljardeja kertoja. Se on tieteellinen koe, joka tapahtuu laboratorion sijasta tietokoneen sisällä.

Sairauden synty

Vattulainen mallintaa tietokonesimulaatioilla molekyylien toimintaa soluissa. Hän näkee laskennallisessa tieteessä suuria mahdollisuuksia terveyden edistämiseen. Sairauksia olisi helpompi ennaltaehkäistä, jos niiden riskejä voisi ennakoida vaikkapa verinäytteistä.

— Tutkimuksemme auttaa hahmottamaan, kuinka terve elimistö käyttäytyy solu- ja kudostasolla ja kuinka sairaus syntyy. Silloin ymmärretään, kuinka ongelmat voidaan välttää. 

Kun Vattulainen vuonna 2001 perusti ensimmäisen tutkimusryhmänsä silloiseen Teknilliseen korkeakouluun, hänen oli vaikea löytää yhteistyökumppaneita. Silloin kokeellisella puolella ei uskottu, että laskennallista biofysiikkaa tarvittaisiin mihinkään. Vasta neljän–viiden vuoden uurastuksen jälkeen yhteistyöstä kiinnostuneita kumppaneita alkoi löytyä.

Muutaman viime vuoden aikana hän on julkaissut yhteisartikkeleita reilun kolmenkymmenen kokeellista tutkimusta tekevän ryhmän kanssa. Niiden joukossa on esimerkiksi lääketieteen, solubiologian, biokemian ja biokuvantamisen tutkimusryhmiä.

Samaa kieltä

Kokeellisesta tutkimuksesta syntyy valtavia määriä dataa, jota laskennalliset fyysikot voivat hyödyntää simulaatioissaan.

Samalla käytännön työ muuttuu, kun tutkimus vaatii tiivistä yhteistyötä eri alojen kesken. Se ei aina ole helppoa.

— Vie aikaa oppia puhumaan samaa kieltä eri alojen tutkijoiden kanssa. Se on vuosien prosessi, että päästään edes samalle sivulle, laskennallisen aerosolifysiikan professori Hanna Vehkamäki toteaa.

Vehkamäki ja Vattulainen ovat laskennallisia tutkijoita, jotka tekevät yhteistyötä kokeellisten tutkijoiden ja tietojenkäsittelytieteilijöiden kanssa. Jos haluaa simulaatiomallin olevan validi, se vaatii jatkuvaa yhteistyötä kokeellisten ryhmien kanssa. Niiltä tulee tärkein data.

— Usein tutkimus lähtee yhteisestä kysymyksenasettelusta. Kokeellinen ryhmä antaa tutkimustuloksiaan ja me testaamme niitä. Annamme takaisin simulaatiotulokset, joita he puolestaan testaavat. Prosessi elää jatkuvassa vuorovaikutuksessa ja koko ajan päästään syvemmälle kysymykseen, Vattulainen kuvaa.

Pois palloista

Ennen tietokonesimulaatioita fyysikot laskivat mallinnuksia kynällä ja paperilla, mikä vaati suuria yksinkertaistuksia. Vehkamäki tuli vuonna 1992 kesätöihin Helsingin yliopistoon projektiin, jossa selvitettiin, pystytäänkö tietokoneella ratkaisemaan yhtälöt hiukkasmuodostuksen nopeudesta ilman yksinkertaistuksia. Vastaus oli kyllä. 

— Laskentateho mahdollistaa tarkkuuden. Molekyylejä ei ole pakko enää kuvata palloina, vaan ne voi esittää oikeissa muodoissaan.

Vehkamäen ryhmän tavallinen simulaatio on selvittää, kuinka ilmakehään päätyneet hiukkaset ovat vuorovaikutuksessa keskenään. Muodostavatko ne uusia hiukkasia tai tiivistyvätkö ne muiden hiukkasten pinnalle?

Mittauslaitteiden herkkyys ei riitä tähän: joitain tutkittavista aineista on ilmassa niin vähän, että mittarit näyttävät nollaa. Mallinnukset ovat paljastaneet, että monet ennusteet ovat olleet vääriä: aineet käyttäytyvät toisin kuin on luultu.

— Molekyylin yksityiskohdilla on todellakin väliä.

Kuinka käy?

Rikki- ja typpiyhdisteet ovat vähenemässä, koska sääntely on vähentänyt tehtaiden ja liikenteen päästöjä. Siksi ilmakehää hallitsevat yhä enemmän orgaaniset yhdisteet. Lämpötilan nousu lisää niiden haihtumista, mutta niitä tulee ilmaan myös ihmisten käyttämistä arkisista kemikaaleista.

— New Yorkissa ilman yhdisteistä suurempi osa tulee nykyään hajusteista ja siivousaineista kuin liikenteestä, Vehkamäki kertoo.

Ilmakehän kemiallinen koostumus on muuttumassa, emmekä tiedä, kuinka se tulee käyttäytymään. Sitä ei voi mitata, koska vielä muutos ei ole toteutunut.

— Me haluaisimme ennustaa, kuinka käy ja mihin ongelmiin pitäisi seuraavaksi keskittyä. 

Vehkamäki vetää kehitteillä olevaa Vilma-virtuaalilaboratoriota. Tavoitteena on rakentaa virtuaalinen malli siitä, miten hiukkaset muodostuvat. Sillä voidaan myös analysoida laboratoriokokeiden tulokset tarkemmin.

— Mittaus näyttää prosessista yhden puolen. Mallinnuksella voimme ymmärtää paremmin, mitä mitatut asiat kertovat ja testata, mitä kannattaa seuraavaksi mitata. Se auttaa suunnittelemaan uusia tutkimuskysymyksiä.

Solun postia

Laskennallinen tiede täydentää kokeellista tutkimusta. Jos samaan kysymykseen on useampi toisistaan riippumaton lähestymistapa, väärän tuloksen ja tulkinnan mahdollisuus pienenee. 

Kuinka sitten voidaan olla varmoja siitä, että simulaatiomallit vastaavat todellisuutta? Tuloksia verrataan jatkuvasti kokeelliseen dataan ja mallia parannetaan niin kauan, että kaikki tulokset ovat yhteensopivia kokeellisen datan kanssa. Sen jälkeen mallilla voi ennustaa jotain täysin uutta.

— Jos proteiinin rakenne tunnetaan, on mallin ennustusvoima lähellä sataa prosenttia. Silloin ei muuta kuin paukuttaa dataa ja tulkitsee sitä oikein, Vattulainen sanoo.

Vattulaisen ryhmä on ennustanut useita ilmiöitä, jotka on myöhemmin vahvistettu kokeellisesti, kun teknologia on kehittynyt. Yksi onnistunut simulaatio liittyi solukalvoproteiineihin, jotka ottavat vastaan signaaleja ja toimittavat niitä eteenpäin. Vattulaista kiinnosti, miten viestit kulkevat ja hän päätti mallintaa tilanteen.

— Solukalvoproteiinit ovat kuin solun paikallisia postitoimistoja. Proteiini valitsee ympärilleen tiettyjä lipideitä lakeijoikseen, jotka hierovat sopivalla tavalla sen kylkeä. Jos proteiinin ympärillä on vääriä lipideitä, se menee lakkoon. Posti kulkee vain silloin, jos ympäröivät lipidit ovat mieluisia.

Elämän ihme

Vattulainen tutustui simulaatioihin ensi kertaa, kun hän tutki väitöskirjassaan, kuinka polttomoottoriautoissa voidaan materiaalivalinnoilla edistää pakokaasujen puhdistamista, kun nämä kaasut liikkuvat pitkin erilaisia pintoja. Materiaalitieteet eivät kuitenkaan olleet hänen lopullinen valintansa. 

— Lapsena minulla oli tapana pohdiskella, mitä on ihmisen sisällä, mikä pitää meitä elossa, miten luonto uusiutuu, miten elämä etenee. Väitöskirjani edetessä tajusin, että nyt minulla saattaisi olla valmiuksia löytää vastauksia näihinkin kysymyksiin.

Siihen aikaan Suomessa ei opetettu laskennallista biofysiikkaa missään, joten Vattulainen lähti tutkijatohtoriksi ulkomaille. Palattuaan hän alkoi yhdistää biofysiikkaan laskennallisia tieteitä. Tavoitteena on matkia luontoa erittäin tarkasti.

Varsinaisia elämäntieteitä Vattulainen ei ole koskaan opiskellut.

— Opetan nykyään biofysiikkaa ja elämäntieteitä laidasta laitaan. Silti ainoa kurssi, jonka olen suorittanut biologiasta, on lukion biologia. Tekemällä oppii, kun on motivaatiota.

Laskennan rajat

Tieteen tietotekniikan keskus CSC tarjoaa Suomessa palveluitaan kaikille tutkijoille. Sen käytössä on Lumi, joka on yksi maailman nopeimmista supertietokoneista. 

— Suomi on loistava maa tehdä laskennallista tutkimusta. Monissa muissa maissa on vaikea saada laskenta-aikaa, mutta täällä sitä ongelmaa ei ole, Vattulainen toteaa.

Ennen kuin tietokoneiden laskentateho kasvoi, ongelmat piti valita sen mukaan, mitä pystyi teknisesti ratkaisemaan. Nyt kysymykset voivat olla monimutkaisempia. Katto nousee lähemmäs taivasta, kun kvanttitietokoneet tulevat. Aina on silti olemassa raja, jota ei voi ylittää.

— Jos haluaa simuloida atomitasolla koko solun, se ei tule onnistumaan, ei 25 vuodessakaan. Myös veden mallintaminen on pirullisen vaikeaa, Vattulainen sanoo.

Ei voimalla

Jos yhdisteitä on paljon ja ne ovat monimutkaisia, laskut räjähtävät käsiin, Vehkamäki toteaa.

— Kuvittelimme aluksi, että voimme laskea kaikki mahdolliset ilmakehän molekyyliyhdistelmät, mutta huomasimme, että raa'alla voimalla ei niitä ratkota. Laskenta kestäisi supertietokoneeltakin yli universumin iän.

Ilmakehässä on yli satatuhatta erilaista yhdistettä, jotka reagoivat keskenään ja muodostavat uusia hiukkasia. Mahdollisia molekyyliyhdistelmiä on loputtoman paljon. Siksi avuksi on otettu koneoppiminen ja tekoäly. Molekyylejä ryhmitellään niiden käyttäytymisen perusteella, jotta laskentatehon tarve vähenisi.

Vaikka Hanna Vehkamäkikin kehuu CSC:n palveluja ja toteaa, että suomalaisilla on koneille pääsyn suhteen kissanpäivät, sekään ei aina tahdo riittää.

— Ruokahalu kasvaa nopeammin kuin laskentateho. Meidän työmme ytimessä on miettiä, mikä lasketaan tarkasti ja missä voidaan yksinkertaistaa: miten kikkaillaan eteenpäin, kun laskentateho ei riitä.

Huippuhetki

Rajoitteista huolimatta mallintamalla pystytään lisäämään ymmärrystä monista ilmiöistä. Tästä hyvä esimerkki liittyy masennuslääke Prozacin käyttäytymiseen, jota Ilpo Vattulainen selvitti Eero Castrénin ryhmän kanssa. 

Kävi ilmi, ettei lääke ohjannutkaan sitä proteiinia, mitä oli luultu, vaan meni ihan toiseen proteiiniin. Paljastui myös, että se tarttuu reseptoriin heikosti ja lähtee helposti pois. Lääkettä on siis oltava paljon tarjolla, jotta sen vaikutus pysyy yllä. Kliiniset havainnot tukevat tulosta: Prozacia on syötävä paljon ja pidemmän aikaa ennen kuin se alkaa tepsiä. 

Oivallus oli yksi Vattulaisen mallinnusuran huippuhetkistä.

— Kun simulaatiomallista pystyy todistamaan ilmiön ja havaitsemaan datasta jotain uutta, saattaa olla ensimmäinen ihminen maailmassa, joka näkee sen. Se on ihan parasta, sen parempaa ei ole olemassakaan. 

Yliopisto-lehti on Helsingin yliopiston tiedeaikakauslehti, joka on sitoutunut Journalistin ohjeisiin.

Lainalaisuuksia etsimässä

Digitaalisten ihmistieteiden professori Eetu Mäkelä tutkii sitä, miten suurteholaskentaa voisi käyttää ihmistieteiden apuna. Hän itse on tietojenkäsittelytieteilijä, joka päätyi ihmistieteiden pariin hieman sattumalta, kansainvälisten yhteistyöprojektien kautta. 

— Ymmärsin, että näillä tieteenaloilla on todella kiinnostavia ja haastavia kysymyksiä ja aineistoja. Täältä saan sen, mitä tarvitsen.

Mäkelä tekee yhteistyötä folkloristien, historioitsijoiden, mediatutkijoiden, kielitieteilijöiden, kieliteknologien ja tietojenkäsittelytieteilijöiden kanssa.

Laskennallisilla tieteillä voidaan tehostaa perinteistä laadullista tutkimusta löytämällä uusia kiinnostavia dokumentteja. Isoja aineistoja voidaan myös käsitellä määrällisesti ja löytää suuria linjoja.

— Minua kiinnostaa, voiko aineistoista etsiä yleisiä lainalaisuuksia ja jos voi, niin miten. Ihmisten tuottama materiaali on monisyistä. Laskennallisia menetelmiä varten aineistoja on pelkistettävä, mutta se johtaa helposti latteisiin ja ilmiselviin tuloksiin. 

Monitieteinen yhteistyö on hankalaa, koska kaikilla tieteenaloilla on erilaiset käsitykset siitä, miten tutkimusta tehdään, miten julkaistaan ja mitä eri käsitteet tarkoittavat.

— Monitieteinen yhteistyö menee usein pieleen siksi, ettei osallistujilla ole mitään hajua siitä, miten toisella alalla tehdään tutkimusta, Mäkelä tuumii. 

Kaikkien olisi oltava kiinnostuneita toisesta näkökulmasta. 

— Sen lisäksi on järjestettävä lukupiirejä, joissa perehdytään alojen peruskäsitteisiin.

Joskus yhteistyökumppanit ehdottavat liian vaikeita tutkimuskysymyksiä, joihin tietokoneet eivät vastaa. Kysymysten haarukointi on tasapainottelua teknisesti mahdollisen ja tutkimuksellisesti kiinnostavan välillä.

— Juuri koskaan kummankaan osapuolen ensimmäinen ajatus ei toimi. Projektit syntyvät ja kehittyvät vuoropuhelussa, Mäkelä sanoo.