– Se on mieletöntä, että teoreettisen kemian oppiaine on kutistumassa juuri nyt, sanoo teoreettinen fyysikko ja kvanttikemian tutkija, akatemiatutkija Susi Lehtola, joka kehittää koneoppimismallien kouluttamiseen laajasti käytettyjä laskennallisia menetelmiä Helsingin yliopistossa.
Me kehitämme menetelmiä, joilla voidaan opettaa koneoppimismalleja ymmärtämään kemiallisia reaktioita tarkasti ja tehokkaasti.
Yksi kvanttikemian perinteisistä haasteista on tarkkuuden ja laskennallisen tehon yhteensovittaminen.
– Jos halutaan mallintaa esimerkiksi protoninsiirtoreaktio vedessä, täytyy pystyä kuvaamaan suuri määrä molekyylejä erittäin tarkasti. Laskentatehon tarve kasvaa pahimmillaan eksponentiaalisesti, jos atomien määrä kasvaa.
Kvanttikemiassa yleisesti käytetyillä likiarvoistetuilla malleilla laskentatehon tarve kasvaa vain polynomiaalisesti, mutta tällöinkin skaalautuvuus asettaa tiukkoja rajoja mallinnettavien systeemien koolle. Esimerkiksi atomien lukumäärän mukaisesti N potenssiin 7 -skaalautuvalla mallilla systeemin koon kaksinkertaistuessa laskun vaativuus kasvaa yli satakertaisesti.
Tutkijan mukaan koneoppiminen on tulevaisuuden avain kemian mallintamiseen.
– Perinteiset menetelmät eivät skaalaudu riittävästi suurille molekyyleille tai monimutkaisille reaktioympäristöille, kuten liuoksille. Koneoppimismallit mahdollistavat perinteisten menetelmien soveltamisen entistä suuremmille systeemeille. Siksi ala on kansainvälisesti kuuma, ja useat suuryritykset kuten Microsoft ja Meta ovat ryhtyneet viime aikoina kemisteiksi.
Kansainväliset suuryritykset ovat mukana kilpailussa, esimerkkeinä Microsoftin Azure Quantum Elements ja Accelerated DFT -ohjelmistotuotteet, sekä Facebookista tutun Metan koneoppimistarkoituksiin tekemä 100 miljoonan molekyylin tietokanta.
Ohjelmistokirjastot nopeuttavat kehitystyötä
Koska ajantasaiset koneoppimismallit sisältävät usein miljoonia parametreja, koneoppimismallien opettaminen vaatii valtavia määriä dataa. Lisäksi opetusdatapisteiden on oltava tasaisen tarkkoja.
Tässä ongelmassa tulee apuun perinteinen kvanttikemia ja ohjelmistokirjastot, joita Lehtola kehittää. Hän painottaa avoimen lähdekoodin ohjelmistojen merkitystä.
– Eteenpäin päästään parhaiten, jos jokainen ei joudu aloittamaan alusta, sanoo Lehtola.
Lehtolan muiden kanssa pitkään kehittämä Libxc -ohjelmistokirjasto on päätynyt kaupalliseen tuotantoon esimerkiksi Microsoftilla, edellämainitun Accelerated DFT-ohjelmiston nojaten Libxc-kirjastoon. Myös Metan 100 miljoonan molekyylin tietokannan muodostamisessa on nojattu Libxc:n toiminnallisuuksiin.
Poikkitieteellinen työ vaatii kansainvälistä yhteistyötä
Kvanttikemiallisten menetelmien kehitys on poikkitieteellistä työtä, jossa yhdistyvät fysiikka, kemia, matematiikka ja tietojenkäsittelytiede.
– Kirjoitan yhtälöitä, ohjelmoin koodia, mietin algoritmeja, sekä mietin mahdollisia sovelluksia. On mietittävä, miten yhtälöt diskretisoidaan, miten liukulukutarkkuus vaikuttaa ja miten koodi toimii supertietokoneilla, sanoo Lehtola.
Hän tekee myös yhteistyötä ranskalaisten soveltavien matemaatikkojen kanssa parempien matemaattisten algoritmien kehittämiseksi.
Tutkijan mukaan Suomessa ei ole riittävästi menetelmäkehittäjiä, ja siksi yhteistyö painottuu ulkomaille.
– On harvinaista, että samassa maassa olisi useampi menetelmäkehittäjä. Siksi kansainvälinen yhteistyö on välttämätöntä.
Fysiikan ja kemian rajat hämärtyvät
Susi Lehtolan kiinnostus kemiaan syntyi jo lukiossa. Hän huomasi kuitenkin, että kemian laboratoriotyöt eivät olleet oma juttu ja päätyi lukemaan teoreettista fysiikkaa mutta päätyi lopulta tutkimaan laskennallisen kemian menetelmiä.
– Ymmärsin, että kemia on sovellettua kvanttimekaniikkaa. Kaikki kemialliset reaktiot ovat pohjimmiltaan elektronien liikettä ja atomien uudelleenjärjestymistä.
Hän korostaa, että fysiikan ja kemian välinen raja on keinotekoinen.
– Kun tutkitaan esimerkiksi veden rakennetta röntgenspektroskopialla tai litiumioniakun toimintaa, ollaan yhtä aikaa kemian ja fysiikan ytimessä. Tieteenalojen perinteet erottavat, mutta ilmiöt yhdistävät.
Suhteellisuusteoria näkyy kultahippusissa ja auton akuissa
Kvanttikemian sovellukset ulottuvat yllättäviin paikkoihin.
– Emeritusprofessori Pekka Pyykkö on osoittanut, että kullan väri ja lyijyakun jännite ovat seurausta suhteellisuusteoreettisista efekteistä. Raskaiden atomien sisimmät elektronit liikkuvat niin nopeasti, että suhteellisuusteoria vaikuttaa niiden käyttäytymiseen – ja sitä kautta kemiaan, sanoo Lehtola
Tutkijan mukaan juuri tällaiset ilmiöt osoittavat, miksi menetelmäkehitystä tarvitaan.
– Jos halutaan ymmärtää kemiaa syvällisesti, tarvitaan tarkkoja malleja ja uusia menetelmiä. Koneoppiminen tarjoaa siihen ennennäkemättömiä mahdollisuuksia – mutta vain, jos osaaminen säilyy ja kehittyy.
Kvanttikemian uudelleenkäytettävien kirjastojen kansainvälinen konferenssi Reusable libraries in quantum chemistry 2025 järjestetään Majvikissa 29.6.–3.7.2025. Paikalle on tulossa yli 70 osanottajaa ympäri maailmaa, edustaen sekä kaupallisia että tieteellisiä ohjelmistoja.
– Konferenssin päämääränä on keskustella siitä, miten ohjelmistoja tulisi kehittää, jotta uusimmista supertietokoneista sekä kvanttitietokoneista saadaan paras mahdollinen hyöty, sanoo konferenssin ideoija Susi Lehtola. Konferenssin järjestäjinä ovat Helsingin yliopiston ja Aalto-yliopiston tutkijat.