VEIL.AI mahdollistaa sensitiivisen terveystiedon turvallisen hyödyntämisen

VEIL.AI on vaativien terveysdataa hyödyntävien hankkeiden tarpeisiin vastaava, Helsingin yliopistolla kehitetty järjestelmä. Sen avulla yksilötasolla kerättyä ja siten sensitiivistä tietoa pystytään hyödyntämään esimerkiksi koneoppivissa ratkaisuissa, erilaisissa kaupallisissa sovelluksissa sekä tutkimus- ja kehityshankkeissa. Sovellus prosessoi tietoja niin, että kerättyjen tietoaineistojen arvo säilyy, mutta yksittäinen ihminen ei ole enää niiden perusteella tunnistettavissa.

VEIL.AI ratkaisee useita terveysdatan käyttöön liittyviä haasteita: se maksimoi sensitiivisen tiedon suojaa anonymisoimalla tai syntetisoimalla dataa, se mahdollistaa datan turvallisen jakamisen ja jatkojalostamisen, se parantaa anonymisoidun tiedon laatua ja mahdollistaa vaikeasti käsiteltävien datatyyppien (kuvantamisdata, signaalidata, reaaliaikaisesti päivittyvä data ja jopa genomidata) anonymisoinnin tai syntetisoinnin.

Lähtökohtana sekä tietosuojan että hyödynnettävyyden maksimointi

VEIL.AI:n kehittäjien lähtökohtana on ollut toteuttaa ratkaisu, joka maksimoi sekä tietosuojan että käsitellyn tietoaineiston hyödynnettävyyden ja minimoi aineiston muokkaamiseen tarvittavan ajan ja laskentakapasiteetin. Perinteisillä menetelmillä tietoja joudutaan usein karkeistamaan niin paljon, että aineistojen jatkohyödynnettävyys kärsii merkittävästi. Perinteiset menetelmät soveltuvat myös huonosti dynaamisten, jatkuvasti päivittyvien tietomassojen anonymisointiin.  Erityisen hankalaa perinteisille menetelmille on, jos sensitiivinen tieto tulee useasta eri organisaatiosta.

VEIL.AI hyödyntää tekoälyä ja tekee laskennallisesti raskaista de-identifikaatioon tarvittavista prosesseista nopeita.

VEIL.AI tarjoaa ratkaisuja erityisesti lääkealan yrityksille ja sairaaloille

VEIL.AI:n tyypillinen asiakas on lääkeyritys, jolla on datan saantiin liittyviä ongelmia. Yksilötason data on GDPR:n alaista henkilötietoa, jonka käyttö saattaa olla haastavaa monista syistä. VEIL.AI:n lähestymistapa pohjautuu havaintoon siitä, että yksilötason sensitiivisen datan sijaan lääketeollisuuden tarpeeseen riittää usein tieto muuttujien välisistä riippuvuuksista. VEIL.AI tarjoaakin menetelmiä, joiden avulla nämä tärkeät riippuvuudet voidaan säilyttää, mutta samalla poistaa datasta tunnistamiseen liittyvät piirteet. Näitä menetelmiä kutsutaan datan anonymisoinniksi tai syntetisoinniksi.

Monet suuret yritykset keräävät asiakkaistaan runsaasti tietoa, jonka hyödyntäminen on tällä hetkellä varsin rajoitettua. Koneoppimisen menetelmiä hyödyntämällä tällaisten laajojen tietoaineistojen analysointi voi tuoda paljon arvoa yrityksille.

Lääketeollisuuden tuotekehitystarpeiden lisäksi sensitiivisellä datalla on paljon muutakin käyttöä esimerkiksi tiedolla johtamisessa, avoimena datana tai lain edellyttämässä niin sanotussa toisiokäytössä. Tallöinkin tietolähteiden anonymiteetti täytyy turvata. VEIL.AI:ta on sovellettu useisiin tällaisiin vaativiin hankkeisiin.

Tutkimushankkeissa on usein oleellista pystyä hyödyntämään usean eri toimijan keräämiä tietoaineistoja. Jotta tämä onnistuisi, toimijoiden pitää yleensä joko jakaa omat tietoaineistonsa hankkeen kaikille osapuolille tai valita yksi taho hoitamaan tietojen yhdistämistä. VEIL.AI:n avulla myös useamman toimijan yhteistyöhankkeista tulee selvästi helpompia, kun niin sanotun raakadatan (käsittelemättömän tiedon) jakaminen aineistojen yhdistämiseksi ei enää ole välttämätöntä.

 

Infograph describing the VEIL.AI process, categories of sensitive data and possible use cases for these data types. More details are available in the figure legend.

 

VEIL.AI:n anonymisointityökaluilla yksilötason tietoa voidaan joko pseudonymisoida (poistaa yksilöivät tunnisteet) tai anonymisoida pysyvästi. Lisäksi VEIL.AI:n avulla voi tuottaa synteettistä dataa. Eri  datatyyppejä voidaan hyödyntää esimerkiksi lääketutkimuksiin, erilaisiin diagnostiikkaan tai omahoitoon liittyviin sovelluksiin sekä erilaisten ennustemallien rakentamiseen.

VEIL.AI soveltuu monenlaisen yksilötason tiedon muokkaamiseen

VEIL.AI on kehitetty Helsingin yliopiston Suomen molekyylilääketieteen instituutissa (FIMM) Janna Saarelan ja Timo Miettisen johdolla. Nykyinen tiimi koostuu heidän lisäkseen kolmesta kehittäjästä. Liiketoiminnan kehittämisestä vastaa teknologia-alan konkari Tuomo Pentikäinen.

VEIL.AI kehittäjäryhmällä on pitkä kokemus haastavien potilasnäytteiden ja biopankkiaineistojen parissa työskentelemisestä.

– Tämän kaltaisten tutkimushankkeiden läpiviemiseksi on vaadittu uusien työkalujen kehittämistä, koska tarkoitukseen soveltuvia ei ole ollut saatavilla. FIMMin kaltaisissa lääketieteelliseen tutkimukseen keskittyvissä organisaatioissa ollaankin tietosuojan osalta useita vuosia muuta maailmaa edellä, toteaa Tuomo Pentikäinen.

Tiimin erikoisalasta huolimatta VEIL.AI:n käyttömahdollisuudet eivät kuitenkaan rajoitu vain lääketieteeseen liittyvien aineistojen käsittelyyn ja niiden perusteella tehtävään tutkimus- ja tuotekehitystyöhön, vaan ovat sovellettavissa kaikenlaiseen yksilötason tietoon. VEIL.AI:ta on sovellettu muun muassa paikkatiedon ja kuvadatan anonymisointiin.

– Eräs voimakkaasti tutkimamme kohde on mm lääkekehityksessä käytettävän synteettisen datan tuotanto, jota kehitämme Novo Nordisk Foundationin tuella, toteaa Tuomo Pentikäinen.

Tiimin erikoisalasta huolimatta VEIL.AI:n käyttömahdollisuudet eivät kuitenkaan rajoitu vain lääketieteeseen liittyvien aineistojen käsittelyyn ja niiden perusteella tehtävään tutkimus- ja tuotekehitystyöhön, vaan ovat sovellettavissa kaikenlaiseen yksilötason tietoon.

Graafi esittää, miten hyvin VEIL.AI:n tuottama synteettinen data vastaa ominaisuuksiltaan alkuperäistä dataa. Graafissa esitetään neljä osajoukkoa (naiset/miehet ja tupakoijat/tupakoimattomat). Tulos on samankaltainen kaikissa ryhmissä.

 

VEIL.AI kykenee tuottamaan synteettistä dataa, joka käyttäytyy hyvin samankaltaisesti kuin alkuperäinen data. Kuvassa on vertailtu aitoa tutkimusdataa (vihreä jakauma) ja VEIL.AI:lla tuotettua synteettistä dataa (keltainen jakauma).

VEIL.AI:n kaupallistamista selvitettiin 2018-19  Business Finlandin Tutkimuksesta uutta liiketoimintaa –rahoituksen avulla. 2019 käynnistyi EIT Digitalin rahoittaman innovaatiohanke, jossa VEIL.AI:n kumppaneina toimivat Philips Hollannista ja SciLifeLab Ruotsista. VEIL.AI:n keskeisestä teknologiasta on myös jätetty patenttihakemus.

– FIMMin ja VEIL.AI-tiimin lähestymistapa on täysin uudenlainen. Toteutamme yhteistä tutkimushanketta, jossa tuotetaan synteettistä dataa ja kehitetään sen laatuun ja käytettävyyteen liittyviä mittareita. Tavoitteena on testata synteettisen datan hyödyntämistä tyypillisesti data-intensiivisissä terveysteknologia- ja lääkekehityskehityshankkeissa. Tavoitteenamme on nopeuttaa merkittävästi R&D-vaihetta, vähentää tai jopa poistaa tietovuotojen riski ja parantaa datan laatua, sanoo professori Henning Langberg Kööpenhaminan HealthTech klusterista ja Kööpenhaminan yliopistosta.

Artikkeli on julkaistu ensimmäisen kerran 23.11.2018 ja päivitetty 25.10.2019 sekä 10.11.2020.

Slush & Unicorner 2019: Innovation VEIL:AI