DI Ananth Mahadevan puollustaa väitöskirjaansa"Scaling and Maintaining Machine Learning Pipelines" torstaina 12.12.2024 klo 12 Helsingin yliopiston Athena-rakennuksen salissa 107 (Siltavuorenpenger 3 A, 1. kerros). Vastaväittäjänä toimii apulaisprofessori Hong-Linh Truong (Aalto-yliopisto) ja kustoksena apulaisprofessori Michael Mathioudakis (Helsingin yliopisto). Väitöstilaisuus pidetään englanniksi.
Ananth Mahadevanin väitöskirja on osa Helsingin yliopiston tietojenkäsittelytieteen osastolla ja Algorithmic Data Science -ryhmässä tehtävää tutkimusta. Väitöskirjan ohjaajana on toiminut apulaisprofessori Michael Mathioudakis (Helsingin ylipisto).
Koneoppimislinjastojen skaalaus ja ylläpito
Koneoppimisjärjestelmät ovat tulleet välttämättömiksi monilla eri aloilla, kuten sosiaalisessa mediassa ja sähköisessä kaupankäynnissä, missä niitä käytetään parantamaan päätöksentekoa, automatisoimaan monimutkaisia tehtäviä ja tuottamaan havaintoja valtavista tietokokonaisuuksista. Kun näissä järjestelmissä käsiteltävän tiedon määrä ja nopeus kasvavat eksponentiaalisesti, niihin liittyvät koneoppimislinjastot, jotka hoitavat tiedonhallinnan, mallin koulutuksen, käyttöönoton ja seurannan, kohtaavat merkittäviä haasteita. Näiden linjastojen skaalaaminen gigatavuista teratavuihin aiheuttaa huomattavia laskennallisia pullonkauloja. Lisäksi dynaamisissa ympäristöissä muuttuvat tietojakaumat heikentävät koneoppimislinjastojen suorituskykyä ajan myötä. Näiden ongelmien ratkaiseminen on keskeistä kehitettäessä skaalautuvia ja ylläpidettäviä koneoppimislinjastoja.
Tämä väitöskirja käsittelee näitä haasteita tutkimalla neljää keskeistä tutkimusaihetta: koneoppimislinjastojen tehokasta koulutusta, vikasietoisuutta, päivitettävyyttä ja kustannustietoisuutta. Ensimmäisenä tarkastelemme kutakin teemaa erikseen vastataksemme tiettyihin tutkimuskysymyksiin. Tehokkaan koulutuksen osalta tunnistamme ja lievennämme laskennallisia pullonkauloja, kun skaalaamme JANE-nimisen uuden solmujen luokittelualgoritmin soveltumaan suurten verkkotietokantojen käsittelyyn. Vikasietoisuuden osalta analysoimme WM-SKETCH-nimisen pakatun lineaarisen luokittelijan kestävyyttä vastustaa koneoppimismalleihin kohdistuvia hyökkäyksiä. Päivitettävyyden kohdalla arvioimme eri menetelmiä, joiden avulla voidaan tehokkaasti unohtaa poistettuja harjoitusaineiston tietopisteitä. Lopuksi kustannustietoisuuden osalta kehitämme algoritmeja, joiden avulla voidaan tehdä uudelleenkoulutuspäätöksiä, jotka tasapainottavat koneoppimislinjaston laskentakustannuksia ja suorituskykyä.
Tässä väitöskirjassa tarjoamme myös alusta loppuun ulottuvan näkökulman, jota havainnollistetaan ReceptionReader-nimisellä järjestelmällä, joka on suunniteltu historiallisten asiakirjojen laajamittaiseen analysointiin. Järjestelmä toimii käytännön esimerkkitapauksena ilmentäen, kuinka jokaisen tutkimusteeman haasteet ilmenevät todellisessa maailmassa. Esittelemme näihin käytännön haasteisiin ratkaisuja miljoonien kokonaisten digitoitujen asiakirjojen vikasietoisesta esikäsittelystä kustannustietoisten toteutusvalintojen tekemisen järjestelmän optimoimiseksi. Näiden ratkaisujen avulla ReceptionReader-järjestelmälle saadaan aikaan skaalattava ja ylläpidettävä koneoppimislinjasto, joka auttaa tutkijoita tekemään uusia analyysejä historiallisista asiakirjoista.
Yhteenvetona tämä väitöskirja esittelee tutkimustietoa ja käytännön ratkaisuja koneoppimislinjastojen skaalaamiseen ja ylläpitämiseen. Käsittelemällä laskennallista tehokkuutta, vikasietoisuutta ja operatiivisten kustannusten hallintaa se tarjoaa kattavan tiekartan suuriin koneoppimisjärjestelmiin liittyvien monitahoisten etu/haitta-näkökulmien käsittelyyn. Esitellyt strategiat eivät ainoastaan paranna koneoppimisprosessien tehokkuutta, vaan myös varmistavat niiden sopeutumiskyvyn ja kestävyyden muuttuvissa ympäristöissä, mahdollistaen näin niiden skaalautuvan ja kustannustehokkaan käyttöönoton.
Väitöskirjan saatavuus
Väitöskirjan elektroninen versio tulee olemaan saatavilla Helsingin yliopiston avoimessa julkaisuarkistossa Heldassa osoitteessa http://urn.fi/URN:ISBN:978-952-84-0744-7.
Painettuja väitöskirjoja voi tiedustella väittelijältä itseltään: ananth.mahadevan@helsinki.fi.