Miten generatiivista tekoälyä voisi liittää osaksi ohjelmistojärjestelmiä? Kansainvälisessä ELFMo-projektissa tutkijat ja teollisuuden kumppanit etsivät tapoja kehittää uusia digitaalisia palveluja, jotka hyödyntävät laajoja perusmalleja eli LFM-malleja (Large Foundational Model). Tunnetuimpia esimerkkejä laajoista perusmalleista on kieleen erikoistunut ChatGPT.
Laaja perusmalli voi toimia pohjana monenlaisille tekoälysovelluksille. Se voi olla koulutettu käsittelemään monenlaista dataa, kuten kuvia, kaavioita tai puhetta.
– Monet ovat varmasti kokeilleet ChatGPT:n käyttöä. Tavoitteemme on upottaa vastaavia toiminnallisuuksia osaksi ohjelmistoratkaisuja, kuten tietoturvaohjelmistoja, taloautomaatiota tai sähköisen kaupankäynnin järjestelmiä. Tämä tarjoaa ohjelmistoteollisuudelle mahdollisuuden tehdä aivan uudenlaisia älykkäitä tuotteita, sanoo projektin vastuullinen johtaja, tietojenkäsittelytieteen professori Jukka K Nurminen Helsingin yliopistosta.
– Laajoja perusmalleja voi myös muokata kontekstiin. Esimerkiksi ChatGPT:lle tätä muokkausta ei ole oletuksena tehty, minkä seurauksena sen antamat vastaukset ovat usein liian yleisiä. Teknisesti näitä järjestelmiä on mahdollista muokata niin, että ne osaavat vastata erikoistuneessa kontekstissa oikein, Nurminen kertoo.
Kyberrikosten torjuntaa ja sujuvampaa rakentamista
Yksi laajojen perusmallien sovelluskohteista ovat tietoturvakysymykset.
– Generatiivisen tekoälyn kehitys on mahdollistanut kyberrikollisille täysin uudenlaisia mahdollisuuksia ja työkaluja entistä tehokkaampiin huijauksiin. Tutkimus- ja kehitystyömme vastaa tähän trendiin, jotta uhkakuvilta ja hyökkäyksiltä voidaan suojautua. Laajojen perusmallien avulla voimme kehittää sekä tietoturvateknologiaa ja -osaamista että kuluttajan tietoturvakokemusta. Laajat perusmallit tarjoavat uusia mahdollisuuksia entistä yksilöidympien tietoturvatuotteiden kehittämiseksi, sanoo tietoturvayhtiö F-Securen tutkimustiimin vetäjä Abdullah Al Mazed.
Rakennus- ja kiinteistöalan asiantuntijayritys Granlund näkee laajojen perusmallien kehittämisessä uusia mahdollisuuksia rakennetussa ympäristössä.
– Tällä alalla data on moninaista: tekstiä, taulukoita, kuvia, piirustuksia ja kaavioita. Se on myös rakennusten virtuaalisia malleja, aikasarjatietoja ja tietokantoja. Tästä seuraa, että samaa rakennusta koskevat kriittiset tiedot ovat usein hajallaan ja eri muodoissa. Laajojen perusmallien avulla pyrimme kuromaan umpeen nämä aukot ja saamaan tiedonhakuun ja analysointiin yhtenäisemmän lähestymistavan. Tietojen yhdistämisen lisäksi laajat perusmallit voivat auttaa asiantuntijoita hoitamalla kevyempiä analyysitehtäviä, lisäämällä tehokkuutta ja tukemalla tietoon perustuvaa päätöksentekoa, sanoo Granlundin johtava tekoälyasiantuntija Davor Stjelja.
Tutkijat muistuttavat, että laajat perusmallit haastavat koko ohjelmistoalan.
– Perusmallit ovat tulossa osaksi monia tietoteknisiä tuotteita ja palveluita, ja tämän yhdistelyn teknisestä osaamisesta on tulossa keskeinen kilpailutekijä ohjelmistoteollisuudelle, sanoo tutkimuksen eurooppalaisen konsortion vetäjä, tietojenkäsittelytieteen yliopistotutkija Mikko Raatikainen Helsingin yliopistosta.
Helsingin yliopiston koordinoima ELFMo-tutkimusprojekti kuuluu kansainvälisen ohjelmistoalan innovaatioverkosto ITEAn hallinnoimaan kokonaisuuteen, jossa on mukana useita teollisuusvetoisia tutkimushankkeita. Helsingin yliopisto käyttää hankkeeseen 2,2 miljoonaa euroa, josta valtaosan rahoittaa Business Finland. Tutkimus kestää vuoden 2027 syyskuuhun.