Datatiede voi pian paljastaa valeuutisia

Tietoturvayhtiöt tarvitsevat tulevaisuudessa yhä enemmän datatieteilijöiden osaamista, sanoo uusi datatieteen apulaisprofessori Nikolaj Tatti.

Tavalliselle tallaajalle tietoturva tarkoittaa lähinnä tietokoneiden virustorjuntaohjelmia, mutta Nikolaj Tatti ​​​​​​vakuuttaa, että se on paljon muutakin.

Hän aloitti helmikuussa 2018 yksityisyyttä suojaavan ja turvallisen datatieteen apulaisprofessorina Helsinki Centre for Data Science -tutkimuskeskuksessa (HiDATA).

– Tietoturva on hirvittävän laaja käsite. Yksinkertaisimmillaan kyse on juuri virustentorjunnasta ja roskapostiohjelmista, mutta toisessa ääripäässä ovat mutkikkaat kohdennetut hyökkäykset isoihin organisaatioihin. Jälkimmäiset päätyvät uutisiin esimerkiksi silloin, kun suuren käyttäjäjoukon tiedot on viety, Tatti sanoo.

Hän uskoo, että tietoturvassa riittää datatieteilijöille työtä vastaisuudessa. Virukset ja hyökkäykset muuntuvat koko ajan. Tekoälykään ei pysty tunnistamaan aivan uudenlaisia muotoja. Tarvitaan ihmistä.

– Tietoturvassa minua kiehtoo se, miten se muistuttaa biologista prosessia. Jatkuvasti uusiutuvia viruksia ei turhaan kutsuta viruksiksi. Biologisen prosessin selvittäminen on erittäin työlästä. Tietoturvassa kaiken avaaminen juuria myöden on jonkin verran helpompaa. Asian saa valmiiksi, Tatti kuvailee.

Tietoturvayhtiöt ovat viime aikoina alkaneet yhä enemmän hyödyntää datatieteilijöiden osaamista. Tietoturvan ylläpitäminen edellyttää näet valtavien datamassojen käsittelyä.

– Tiedonlouhinta on datatieteilijöiden alaa. Verkkotiedostojen läpikäyminen silmänvaraisesti on hyvin työlästä. Tässä me voimme auttaa tietoturva-asiantuntijoita kehittämällä menetelmiä, joilla kaivaa etsitty signaali esiin, Tatti selittää.

Itse hän aikoo yliopistolla keskittyä virusten ja hyökkäysten mallintamiseen. Siis esimerkiksi siihen, millaisia yhteisiä piirteitä hyökkäyksissä on ja miten ne etenevät.

– Työni on perustutkimusta. Siitä on vielä pitkä matka sovelluksiksi, joita vaikkapa yritykset voisivat hyödyntää, hän huomauttaa.

Piipahdus yritysmaailmassa 

Ennen yliopistolle tuloaan Tatti työskenteli puolitoista vuotta tietoturvayhtiö F-Securessa datatieteen asiantuntijana. Hän tutki, miten tiedonlouhinta voisi parantaa yrityksille suunnattuja turvallisuustuotteita.

– Erityisesti keskityin siihen, miten yksittäisiin yrityksiin kohdennettuja hyökkäyksiä voisi torjua helpommin. Tällaisissa hyökkäyksissä pahantahtoinen ihminen koettaa murtautua organisaation tietojärjestelmään ja aiheuttaa tuhoa. Juuri yksittäisten ihmisten tekemien hyökkäysten havaitseminen on vaikeaa, koska ne ovat usein hyvin monimutkaisia ja vaativat suuren datamäärän käsittelyä, Tatti selittää.

Ennen F-Securea Tatti työskenteli Aalto-yliopistossa tutkijana. Hänen mukaansa piipahdus yritysmaailmassa oli mielenkiintoinen kokemus.

–Jokainen yritys on vähän erilainen ja jokaisessa tehdään vähän erilaista työtä. Apulaisprofessorin työ taas on pitkälti samanlaista yliopistosta riippumatta, hän sanoo.

Yhteistyötä yritysten kanssa

Yliopistolla Tatti tekee paitsi tutkimusta myös opettaa datatieteen opiskelijoita. Opettajana hän tähdentää itsenäisen ajattelun merkitystä.

– Asiat voi opetella pintapuolisesti, sääntöjä tankkaamalla. Tyyliin ongelma x ratkaistaan työkalulla y. Parempi olisi kuitenkin sisäistää asiat syvällisesti ja nähdä yhteyksiä eri asioiden välillä. Pysähtyä kysymään, miksi on tehty näin. Tämä on työläämpää, mutta maksaa kyllä vaivan, Tatti sanoo.

Hän näkisi datatieteessäkin mieluusti vielä nykyistä enemmän yhteistyötä yliopiston ja yritysten välillä. Vaihdosta hyötyisivät hänen mukaansa kaikki. Yritykset olisivat entistä tiiviimmin kosketuksessa tutkimukseen ja tutustuisivat uusiin tekijöihin. Opiskelijat puolestaan saisivat työkokemusta ja harjoittelupaikkoja. Ja yliopiston tuntuma yritysmaailmasta ja yritysten kuumista kysymyksistä kohenisi.

Valeuutisille stoppi

Juuri nyt datatieteen ja tietoturvan kuumia kysymyksiä ovat Tatinkin tutkimuksen kohteena olevat kohdennetut hyökkäykset. Ne ovat yleistyneet koko ajan.

Muutaman vuoden päästä tietoturvaan paneutuneet datatieteilijät saattavat Tatin mukaan askaroida varsin erilaisten pulmien kanssa.

– Somessa leviävien valeuutisten tunnistaminen on hyvin vaikea ongelma, joka nousee meidänkin työpöydällemme. On erittäin vaikea kehittää järjestelmää, joka tunnistaisi valeen sataprosenttisesti, Tatti arvioi.

Tekniikan kehittyessä myös valevideot, joihin liitetään jälkikäteen toisen ihmisen kasvot, saattavat nousta ongelmaksi, jolla voi olla dramaattisia seurauksia. Toistaiseksi tekniikka on kömpelöä, mutta jo muutaman vuoden päästä voi olla silmänvaraisesti mahdoton arvioida, puhuuko videolla todella esimerkiksi Vladimir Putin.

– Valevideot voivat saada pahaa aikaan. Niidenkin tunnistamiseen meidän pitää varautua, Tatti sanoo.

Esit­te­lys­sä Hi­DATAn uu­det asian­tun­ti­jat

Tässä juttusarjassa esittelemme Helsinki Centre for Data Science -tutkimuskeskuksen (HiDATA) uusia tenure track -professoreita. 

Tutustu muihin osiin:

Spatiotemporaalisen data-analyysin apulaisprofessori Laura Ruotsalainen: Ih­mis­ten liik­keet aut­ta­vat suun­nit­te­le­maan pa­rem­pia kau­pun­ke­ja

Rinnakkaisen ja hajautetun datatieteen professori Keijo Heljanko: Kas­va­vat da­ta­mas­sat voi­vat jät­tää tie­to­ko­neet jäl­keen­sä ja ai­heut­taa ener­gia­krii­sin

Tietojenkäsittelytieteen ja ilmakehätieteiden apulaisprofessori Kai Puolamäki: Da­ta­tie­de tul­kit­see il­ma­ke­hän hiuk­ka­sia ja auttaa löy­tä­mään kau­pun­gin puh­taim­mat kul­ku­rei­tit – jos osaam­me ky­syä ko­neel­ta oi­kei­ta asioi­ta

Koneoppimisen ja tekoälyn apulaisprofessori Antti Honkela: Si­nul­la­kin on sa­lai­suuk­sia - ko­neop­pi­mi­sen pi­tää kun­nioit­taa yk­si­tyi­syy­den suo­jaa

Koneoppimisen ja tekoälyn apulaisprofessori Dorota Głowacka: Tu­le­vai­suu­den ha­ku­ko­ne auttaa käyt­tä­jää löy­tä­mään myös sel­lai­sen tie­don, jota tämä ei tie­dä et­si­vän­sä