Antti Klemetti väittelee aiheesta Käytännön menetelmiä kustannustehokkaaseen syväoppimiseen

FM Antti Klemetti väittelee perjantaina 13.2.2026 aiheesta Kustannustehokas syväoppiminen: Menetelmien luokitus, käytännön kokeita ja näkymiä ohjelmistoteollisuuteen. Väitöskirjatyö on osa Helsingin yliopiston tietojenkäsittelytieteen osaston Empirical Software Engineering -ryhmässä tehtävää tutkimusta.

FM Antti Klemetti puolustaa väitöskirjaansa "Practical Approaches to Cost-Efficient Deep Learning: Taxonomy, Experiments, and Industry Insights" perjantaina 13.2.2026 klo 13 Helsingin yliopiston Athena-rakennuksen auditoriossa 107 (Siltavuorenpenger 3 A, 1. kerros). Vastaväittäjänä toimii apulaisprofessori Alexander Jung  (Aalto-yliopisto) ja kustoksena professori Jukka K. Nurminen (Helsingin yliopisto). Väitöstilaisuus pidetään englanniksi.

Antti Klemetin väitöskirjatyö on osa Helsingin yliopiston tietojenkäsittelytieteen osastolla ja Empirical Software Engineering -ryhmässä tehtävää tutkimusta. Väitöskirjan ohjaajina ovat toimineet professori Jukka K. Nurminen ja yliopistotutkija Mikko Raatikainen (Helsingin yliopisto) sekä professori Tommi Mikkonen (Jyväskylän yliopisto).

Kustannustehokas syväoppiminen: Menetelmien luokitus, käytännön kokeita ja näkymiä ohjelmistoteollisuuteen

Tekoälyn hyödyntäminen muovaa sekä yritysten että valtioiden tulevaisuuden strategioita. Tekoälyn nousua päivittäisiin uutisotsikoihin selittää konenäön ja suurten kielimallien nopea kehitys. Molemmat tekoälyn sovellusalueet perustuvat syväoppiviin neuroverkkoihin. Neuroverkkoja käsitellään tietokoneissa numeerisina matriiseina, joiden koko on kasvanut niin suureksi, että siihen tarvitaan matriisilaskentaan erikoistunutta laitteistoa, kuten grafiikkasuorittimia. Grafiikkasuoritinten hinta on puolestaan moninkertainen yleiskäyttöisten suorittimiin verrattuna. Datakeskusten raskain ja kallein laskenta liittyykin neuroverkkoihin.

Tässä väitöskirjassa tutkimme miten neuroverkkoja voidaan kouluttaa ja käyttää kustannustehokkaasti. Ongelman laajuuden hahmottamiseksi lisäsimme kysymyksiä tekoälyn kustannuksista vuoden 2025 ohjelmistoyrityskartoitukseen. Teimme systemaattisen kirjallisuuskatsauksen, ja sen perusteella luokituksen menetelmistä, joilla neuroverkkojen kustannuksia voidaan alentaa. Kirjallisuuskatsauksessa käsitellyistä lähestymistavoista tutkimme kahta tarkemmin käytännössä. Kokeilimme Kaggle-palvelun kilpailujen voittaneita neuroverkkoja käyttäen kuinka suuren osan neuroneista voi poistaa menettämättä neuroverkon ennustustarkkuutta. Neuroverkkojen koon pienentämistä täydentävänä tapana tutkimme neuroverkkojen koulutusta pilvipalveluiden kustannustehokkaita spottikoneita käyttäen.

Ohjelmistoyrityskartoituksen perusteella tekoälyn kustannukset ovat todellinen huolenaihe, ja kustannusten oletetaan kasvavan merkittävästi seuraavan kolmen vuoden aikana. Kirjallisuuskatsauksessa löysimme useita tapoja alentaa neuroverkkojen kustannuksia pienentämällä neuroverkkojen kokoa sekä valitsemalla niiden suoritusympäristö harkiten. Kokeissamme neuronien poisto ei osoittautunut kovin tehokkaaksi tavaksi alentaa kustannuksia. Spottikoneiden käytöllä puolestaan neuroverkkojen koulutuskulut voidaan jopa puolittaa. Spottikoneiden varjopuolina ovat kuitenkin niiden vaihteleva saatavuus ja ajoittainen pitkä käynnistysaika.

Johtopäätöksenä suosittelemme, että tekoälyn kustannus nostetaan yritysten päätöksenteossa tasavertaiseksi kriteeriksi tarkkuuden rinnalle. Tutkimusyhteisöltä toivomme ratkaisuja suurissa kielimalleissa tärkeässä roolissa olevan Transformer-arkkitehtuurin optimointiin.

Väi­tös­kir­jan saa­ta­vuus

Väitöskirjan elektroninen versio tulee olemaan saatavilla Helsingin yliopiston avoimessa julkaisuarkistossa Heldassa osoitteessa .

Painettuja väitöskirjoja voi tiedustella väittelijältä itseltään: .