Uusi tekoälymenetelmä pitää huolen siitä, että data pysyy yksityisenä

Helsingin yliopiston, Aalto-yliopiston ja tokiolaisen Waseda-yliopiston tutkijoiden kehittämä uusi koneoppimismenetelmä pystyy hyödyntämään esimerkiksi kännyköille hajautettua tietoa niin, että kaikkien datassa edustettujen yksilöiden yksityisyys voidaan turvata.

Moderni tekoäly perustuu koneoppimiseen, joka luo malleja oppimalla datasta. Monissa esimerkiksi terveyteen ja ihmisten käyttäytymiseen liittyvissä tietokonesovelluksissa tarvittu data sisältää yleensä myös yksityistä tietoa, jota pitää suojata. Viime vuosina suojauksen takaamiseksi on kehitetty differentiaalisen yksityisyyden käsitteeseen perustuvia niin sanottuja yksityisyystietoisia koneoppimismenetelmiä, jotka takaavat sen, ettei julkaistu malli tai tulos paljasta kuin rajoitetusti informaatiota kustakin datassa edustetusta yksilöstä.

yksityisyystietoisia koneoppimismenetelmiä

- Aiemmin data on ensin pitänyt kerätä yhdelle taholle, jolla on rajaton pääsy kaikkeen, kun nyt esitetty uusi menetelmämme mahdollistaa tarkkojen mallien luomisen esimerkiksi käyttäjien omille laitteille hajautetusta datasta ilman, että yksityistä dataa tarvitsee paljastaa kenellekään ulkopuoliselle, kertoo apulaisprofessori Antti Honkela Helsingin yliopistosta.

koneoppimista pienestäkin datasta

Helsingin yliopiston ja Aalto-yliopiston tutkijaryhmä on soveltanut yksityisyystietoisia menetelmiä muun muassa syöpälääkkeiden tehon ennustamiseen geenien aktiivisuuden perusteella.

- Olemme kehittäneet näitä menetelmiä Suomen Akatemian rahoituksella muutaman vuoden, ja nyt alkaa näyttää erittäin lupaavalta. Isosta datasta oppiminen on helpompaa, ja nyt oppiminen alkaa olla mahdollista pienestäkin datasta, sanoo akatemiaprofessori Samuel Kaski Aalto-yliopistosta.

Tutkijoiden menetelmä julkaistiin ja esiteltiin joulukuun alkupuolella Yhdysvalloissa järjestetyssä koneoppimisen vuosittaisessa pääkonferenssissa NIPS:issä.

Artikkeliviite: M. Heikkilä, E. Lagerspetz, S. Kaski, K. Shimizu, S. Tarkoma, A. Honkela. Differentially private Bayesian learning on distributed data. In Advances in Neural Information Processing Systems 30 (NIPS 2017)

Lisätiedot

Apulaisprofessori Antti Honkela, 050 311 2483, @ahonkela antti.honkela@helsinki.fi

Viestinnän asiantuntija Minna Meriläinen-Tenhu, 050 415 0316, @MinnaMeriTenhu, minna.merilainen@helsinki.fi