Utelias mieli, jakso 17, tekstiversio: Miten dataa luetaan?

Kesto 36 min

Haastattelija: Reetta Rönkö (RR)
Haastateltava: Aaro Tupasela (AT)

[rauhallista musiikkia]

RR: Aaro Tupasela, mikä on sulle tämän hetken tärkein oivallus datasta?

AT: Tärkein ehkä oivallus on se, että susta on olemassa todella paljon dataa erilaisissa tietokannoissa ja rekistereissä. Se, että näiden tietojen perusteella moni eri toimija luo eräänlaisia kuvia ja johtopäätöksiä sinusta, sinun elämästä ja sun käyttäytymisestä.

[rauhallista musiikkia]

RR: Tämä on Utelias mieli -podcast, joka puhuu tieteestä tunteella.

[rauhallista musiikkia]

RR: Tässä podcastissa tutkija saa puhua siitä, mikä hänen mielestään on juuri nyt kiinnostavaa ja tärkeää. Vieraana on tänään sosiologian dosentti ja DataLit-hankkeen tutkija Aaro Tupasela Helsingin yliopistosta. Tervetuloa.

AT: Kiitos. Kiva olla täällä.

RR: Mä olen Reetta Rönkä tämän podcastin juontaja.

[rauhallista musiikkia, joka vaimenee hiljalleen]

RR: Aaro sun kanssa me keskustellaan tänään siis datasta, sen keräämisestä ja hyödyntämisestä. Datasta on viime vuosina puhuttu tosi paljon. Siihen on liittynyt paljon hypeä. Suunnilleen kaikki yritykset ovat julistautuneet dataohjautuviksi ja dataa on verrattu niin kultaan kuin öljyynkin. Samalla datan ympärillä on ollut aika paljon huolta ja epäluuloa liittyen siihen, miten sitä kerätään, kuka sitä kerää ja mihin tarkoituksiin. Tänään me yritetään kehittää sekä omaa että kuulijoiden datalukutaitoa. Kun mä mietin termiä data, mä näen heti päässäni sellaiset Matrix-henkiset mustavihreänä vilisevät numerosarjat ja nollat ja ykköset. Millainen kuva sun päähän piirtyy, kun sä mietit dataa?

AT: Toi on mun mielestä ihan hyvä kuvaus silleen, että toki data istuu oikein hyvin Excel-taulukoihin ja tuolleen, mutta se voi olla myös tarina sinusta tai minusta.

RR: Okei.

AT: Sä haastattelet mua tässä, ja tässä syntyy dataa. Mä kerron asioita. Tämä nauhoitetaan. Tämä menee nettiin. Tämähän on myös eräänlaista dataa. Jos otetaan uutiskuvaa tai videoidaan, laitetaan nettiin, TikTokia tai tuolleen, nämä on kaikki dataa. Tämä jollain tavalla kuvastaa sitä meidän maailmaa meidän ympärillä, joten se ei ole vain ykkösiä ja kakkosia. Toki voidaan puhua teknisesti, että kaikki se data on ykköstä ja nollaa siellä bittiavaruudessa, mutta jos ajatellaan kaikkia niitä erilaisia kulttuurisia ulottuvuuksia, joita meidän elämään liittyy, se ei ole vain sitä, että siinä on Excel-taulukko, vaan se data ilmenee hirveän monissa eri muodoissa.

RR: Jos lähdetään sieltä datan jostain perimmäisestä merkityksestä, mä olen itselleni yrittänyt selittää dataa niin, että data on raaka-ainetta. Se on massa jotain sellaista rompetta, josta on mahdollista jalostaa jotain suurempaa ja hienompaa kuten vaikka tietoa. Onko tämä sun mielestä yhtään oikeansuuntainen rautalankaselitys?

AT: Mä lähtisin provosoivasti sanoo, että ei...

RR: No niin.

AT: ...että ei ole sellaista kuin raakaa dataa. Aina kun tuotetaan dataa, siihen liittyy eräänlaisia sosiaalisia, yhteiskunnallisia, teknisiä, poliittisia päätöksentekoja, miksi me tuotetaan dataa, miksi me tehdään jotain. Eli data ei ole luonnollinen ilmiö itsessään, vaan siihen aina liittyy jonkinlainen päätös: kuka kerää jotain, miksi sitä kerätään, mihin sitä halutaan käyttää, onko joku keksinyt jonkun toisen syyn, miksi halutaan käyttää sitä ja niin poispäin. Tässä mun alassa eli sosiologiassa ja nimenomaan tieteen ja teknologian tutkimuksessa me pyritään saamaan ihmiset ymmärtämään se, ja tästä on kirjoitettu aika paljon, että ei ole sellaista kuin raakaa dataa.

RR: Aaro, sä olet siis sosiologi. Kerro, miksi data kiinnostaa sua. Mikä siinä viehättää?

AT: Oi, mun kiinnostus tähän datajuttuun itse asiassa lähti jo 2000-luvun alulla, kun mä tein gradua ja sitten aloin tekee väikkäriä. Mä kiinnostuin biopankeista eli biolääketieteellisestä tutkimuksesta, jossa kerätään ihmisperäisiä näytteitä tutkimusta varten. Mua kiinnosti se ala sen takia, että siinä alkoi näkymään alan kehittyminen enemmän ja enemmän ammattimaisemmaksi, eli haluttiin kerätä isoja biopankkeja, isoja näytekokoelmia. Silloin alettiin kysyä kysymyksiä standardoinnista: mitä me kerätään, miksi me kerätään tällaista, voidaanko me kerätä muualta samanlaisia kysymyksiä. Siihen myöskin kietoutui tämä kysymys datasta, eli minkälaista tietoa meistä on eri konteksteissa ja millä tavalla me pystytään yhdistää sitä tutkimusta varten. Sosiologina mua kiinnosta tämä kysymys siitä, että miten tuotetaan sitä tietoa, mitä me tuotetaan tänä päivänä esimerkiksi lääketieteessä, koska tämä ei ole itsestään selvä kysymys mun mielestä. Tieteelliset menetelmät kehittyy, ja niiden mukana myöskin kehittyy ne tavat, joilla me kerätään tietoa tai aineistoa väestöstä ja myöskin, miten me nähdään väestöä ja miten me pyritään sitten vaikuttamaan siihen väestöön.

[rauhallista musiikkia]

RR: Tässä podcastissa tutkijat saavat valita keskustelun aiheen ja teeman. Aaro Tupasela sä haluat tänään puhua siitä, miten dataa kerätään ja hyödynnetään. Yksi avainsana tässä keskustelussa on datalukutaito. Mitä se oikein on?

AT: Datalukutaito on itse asiassa se ymmärrys ja se oivallus ehkä, josta me äsken puhuttiin, että data ei ole luonnollinen ilmiö, vaan se on sosiaalisesti rakennettu. Datalukutaito liittyy siihen, että sä ymmärrät, kun sä näet jotain tietoa tai jotain, että se tulee jostain kontekstista tai sitten jos tulee tieto sun eteen, sä alat miettiä, mistä tämä on tullut, miten tähän on päädytty. Tietenkin korona-aikakaudella tämähän on tullut hyvin selväksi siis silleen, että on erilaisia väitteitä, mitä leijuu sosiaalisessa mediassa ja tuolleen. Yksi osa datalukutaidosta on se, että sä pystyt ainakin pohtimaan ja miettimään sitä, että okei, mistä tämä on tullut, onko tämä luotettava lähde, minkälaisen prosessin tämä datan tuotanto on käynyt läpi, onko tässä ollut minkäänlaista keskustelua, debattia ihmisten kesken vai onko joku vain näppiksellä naputellut tuonne, että maapallo on litteä, ja sitten kaikki hyväksyy sen. Koska jos sä kuulisit sellaisen väitteen, sä varmasti alkaisit miettiä, että hei eihän toi pidä...

RR: Hetkinen.

AT: Hetkinen, niin.

RR: Datalukutaidosta on puhuttu uutena kansalaistaitona. Mä ymmärrän toki tämän, että meidän kaikkien pitää pystyä tavallaan suhtautua kriittisesti erilaisiin tietoihin, koska on olemassa erilaisia tiedon lajeja ja niitä voi tulla eri tuuteista ja niitä pitää pystyä arvioida. Onko oikeasti olennaista, että joka ikinen tavallinen tallaaja osaa lukea dataa? Vai onko ennen kaikkea olennaista, että tietynlaiset portinvartijat, kuten vaikka meidän päättäjät, joiden pitäisi tehdä tietoon pohjautuvia päätöksiä, on aivan huippuhikareita siinä datalukutaidossa, ja meikäläiselle riittää vähän semmoinen välttävämpikin taso?

AT: Ensinnäkin täytyy muistaa, että monet meidän päättäjistä on ihan tavallisia ihmisiä, jotka on äänestetty sinne demokraattisin menetelmin, ja tämä on ihan hyvä asia, että meillä on ihan tavallisia ihmisiä siellä. Datalukutaito ei tarkoita sitä, että jokaisesta pitää tulla tutkija. Ei missään nimessä. Sehän on täysin mahdoton asia. Datalukutaidossa on enemminkin kysymys siitä, että sulla on jonkinlainen käsitys siitä, mistä joku tulee ja myöskin ehkä siitä, miten data sinusta, miten sitä kerätään, kuka sitä kerää, eli sulla on jonkinlainen käsitys siitä, mitä maailmassa sun ympärillä on tapahtumassa. Enhän mäkään pysty loihtimaan itsestäni epidemiologia tai ammattitutkintoa tai tutkintoa siitä, joka vaatii viisi vuotta tai tuolleen, mutta mä pystyn ainakin miettimään sen, kun mä luen jotain lehdestä, että onko tämä taho jollain taholla luotettavampi kuin se, joka tulee Facebookissa silleen, että hei nyt sä teet näin, ja tämä auttaa.

RR: Tarvitseeko erilaiset tahot, erilaiset toimijat sun mielestä erilaista datalukutaitoa? Esimerkiksi just ne päättäjät versus tavalliset ihmiset. Onko päättäjälle vaikka tärkeämpää hallita jonkinlainen datalukutaidon aste kuin jollekin toiselle?

AT: Varmasti se on hyvä asia, ja varmasti siinä harjaantuu. Jos me ajatellaan työttömyyttä, jos mä sanon sulle, että ”hei, osaatko sä lukea työttömyyslukuja”, sä varmasti sanot: ”joo okei”. Sitten mä saatan kysyä sulta: ”mutta tiedätkö sä, että Suomessa lasketaan työttömyyttä kahdella eri tavalla?” On työ- ja elinkeinoministeriö. Heillä on omat menetelmät. Sitten on Tilastokeskus, ja he laskee hieman eri tavalla. Tietenkin jos sä olet päättäjä, on hirveän tärkeä, että sä ymmärrät, että Suomessa on kaksi eri tapaa laskea työttömyyttä, ja nämä luvut on hieman erilaiset toisistaan. Sitten jos sä alat sanoa, että ”hei työttömyys on noussut versus laskenut” ja sitten sä et huomaakaan sitä, että nyt sä vertaat eri laskumenetelmää toiseen laskumenetelmään, sittenhän sä ajaudut hieman ongelmaan, eli siinä mielessä sun täytyy kehittää sellainen datalukutaito, että sä ymmärtäisit, että meillä on eri tapoja laskea työttömyyttä. Jos sä oikeasti haluat verrata työttömyyslukuja tänä vuonna versus viisi vuotta sitten, sulla täytyy olla se sama laskumenetelmä silloin käytössä.

RR: Tästä tietoon pohjautuvasta päätöksenteosta puhutaan myös nykyään paljon, ja sehän on tosi tärkeä asia. Nyt mä ehkä vähän kammottavasti lähestyn uhkakuvien kautta. Mitä pahaa voi tapahtua? Mitä tavallaan mokia voi tapahtua, jos esimerkiksi päättäjillä tai muuten tärkeissä asemissa olevilla ihmisillä ei ole tarpeeksi hyvä datalukutaito?

AT: Meillähän on tässä viimeisen viiden vuoden aikana hyviä esimerkkejä Yhdysvalloista Donald Trumpin aikakaudelta, jolloin Yhdysvaltain presidentti puhui sellaisia asioita, jotka yksinkertaisesti eivät olleet totta, olivat jopa vaarallisia ihmisille. Siinä mielessä toki me ollaan nähty, mitä voi tapahtua, jos päättäjät ei kuuntele asiantuntijoita ja pohdi heidän päätösten merkityksiä. Brasiliassahan Bolsonaro halutaan panna valalta just sen takia, että hän ei ole kuunnellut terveysviranomaisia koronan takia, ja on monia muitakin maita. Tansaniassa presidentti kuoli, koska hän sai koronan ja menehtyi siihen, ja hänen neuvot olivat, että nyt pitää vain rukoilla. No, hän menehtyi siihen. Eli niillä on ihan oikeita seurauksia joskus jopa vaarallisia, mutta täytyy tietenkin muistaa, että ainakin Suomessa se, miten meidän poliittinen järjestelmä on rakentunut, on se, että siellä ei ole vain yksi ihminen tekemässä päätöksiä, vaan siellä on joukko ihmisiä ja siellä keskustellaan. Siellä neuvotellaan ja yritetään löytää hyvä ratkaisu. Sitten tietenkin meillä on erittäin hyvät tutkimusinstituutiot ja yliopistot ja asiantuntijaorganisaatiot, jotka pystyvät tuottaa sitä tietoa, jota tarvitaan, jotta pystytään tekee fiksuja päätöksiä. Mutta tietenkään kellään ei ole kristallipalloa. Tulevaisuuteen on vaikea nähdä, mutta ainakin kannattaa kuunnella asiantuntijoita, jotka ovat tutkineet asiaa ja tietävät siitä jotain.

RR: Jos sulla olisi taikasauva, jolla sä plim saisit vain joka ikisen suomalaisen päähän istutettua yhden ajatuksen tai oivalluksen datasta tai ehkä yhden datalukutaidon pienen jyväsen, mikä se olisi? Minkä asian sä laittaisit meidät kaikki tajuamaan?

AT: Mä haluaisin, että ihmiset tietäisi oikeasti, mitä kaikkea dataa heistä on kerätty ja kerätään koko ajan, eli sä olisit tietoinen siitä. Mä opetan sellaista kurssia kuin AI and Society, ja me aina annetaan tällaisia pieniä tehtäviä. Mä pyydän heitä tekee data checkin, eli selvittämään, minkälaista dataa heistä on olemassa. Eli oletko sä katsonut koskaan Googleen tai tehnyt sieltä pyynnön, mitä dataa Googlella on sinusta tai mitä tietoa sinusta on Väestörekisterikeskuksessa tai luottokunnassa ja niin poispäin. Eli ihan tällaisia yksinkertaisia asioita, jotka saavat meidät miettimään, että ahaa tuolla jossain rekisterissä on minusta tietoa vuodelta X ja Y.

RR: Onko datalukutaidossa ja datan ajattelussa myös vähän jotain sellaista harhaa kuin autoilussa? Tiedätkö, että suurin osa ihmisistä kuvittelee esimerkiksi olevansa keskivertoa parempia autoilijoita? Kuvitellaanko me tai luullaanko me, että me ymmärretään paremmin kuin me itse asiassa ymmärretään?

AT: Toi on oikeastaan ihan hyvä pointti. Varmasti kun me käytetään erilaisia appeja ja ollaan tietokoneella koko ajan, meille tulee sellainen kuva, että me hallitaan tämä, eli me tiedetään, missä se data, jota me tuotetaan tai jota meistä itse asiassa koko ajan harjataan, että me tiedetään, missä se menee. Tämä on ehkä hieman ongelmallista, koska jos me puhutaan tietoturva-asioista ja tuolleen, meille tulee vähän väliä muistutuksia siitä, että ihmisten pitäisi vaihtaa salasanat ja ihan perusjuttuja, että salasana ei saisi olla omaa sukua oleva sukunimi tai tällaiset jutut, koska silloin se data, jota me sinne tuotetaan ja luullaan, että se on turvassa ei välttämättä ole. Silloin kun se pääsee tuonne nettiin, sitä on lähes mahdoton saada sieltä pois. Varmasti siinä on jonkinlainen totuus, että me oletetaan, että me tiedetään, mistä on kyse. Tietenkin tämä on se vanha temppu, että mä kysyn sulta, että oletko koskaan lukenut yhtään niistä tietosuojaselosteista, joita pitää hyväksyä ennen kuin sä otat jonkun appin käyttöön.

RR: Voin luvata, että en ole kyllä lukenut.

AT: Ei varmasti kukaan.

RR: Oletko sä lukenut?

AT: Mä olen joskus lukenut niitä.

RR: Vau.

AT: Mutta se on niin puuduttavaa ja tylsää ja myöskin hyvin vaikeata. Se on ihan tahallaan tehty sellaiseksi, että sä et välttämättä ymmärrä, mistä siinä on kysymys, ellet sä ole nimenomaan asiantuntija jollain alalla. Tämähän tietenkin on ongelma, kun me puhutaan datasta ja lukutaidosta, eli meillä ei ole aina käsitystä siitä, miten meidän dataa käytetään. Tässä on ollut paljon esimerkkejä Facebook-datassa ja näissä muissa caseissa, mihin meidän tietoja jaetaan joskus meidän tietämättä ja joskus myöskin laittomasti. [rauhallinen musiikki alkaa soida taustalla]

RR: Niin, ainakaan tällaisilla hankalilla tietoturvaselostuksilla ei helpoteta, että se datalukutaidon hyödyntäminen olisi helppoa, jos asiat tehdään lähtökohtaisesti jo vaikeiksi.

AT: Aivan, kyllä.

[rauhallista musikkia]

RR: Tämä on Utelias mieli -podcast, joka puhuu tieteestä tunteella.

[rauhallista musiikkia]

RR: Otetaan muutamia esimerkkejä. Vuonna 1987 syntyi suunnilleen 60 000 lasta, ja se on ikäluokka, josta tiedetään tilastollisesti lähes kaikki, sillä vuonna 1987 syntyneillä Terveyden ja hyvinvoinnin laitos THL sekä Nuorisotutkimusverkosto on tehnyt tutkimusta, jossa näitä nykyisiä 34-vuotiaita on tutkittu kohdusta saakka. Miksi tällainen -87 ikäkohortti on datan näkökulmasta jotenkin kiinnostava tai onko se jopa jotenkin esimerkillinen?

AT: Joo. Ensinnäkin jos ajatellaan hieman laajemmassa perspektiivissä, miten tällainen on mahdollinen. Suomihan on sinänsä aika hienossa asemassa muiden Pohjoismaiden kanssa, että meillä on tällainen asia kuin henkilöturvatunnus tai sotu, joka luodaan silloin kun me synnytään, ja se seuraa meitä läpi koko elämän ihan kuolemaan saakka ja senkin jälkeen, kun on perikuntia ja mitä nyt perun jakoa ja tuolleen. Se on myöskin siinä mielessä merkillinen, että aina kun sä olet tekemisissä jonkun kanssa, oli se sitten yritys tai viranomainen tai kirjasto, sun sotua käytetään. Sen takia sinusta on olemassa erittäin paljon tietoa erilaisissa rekistereissä. Oli se sitten väestörekistereissä tai syöpärekistereissä, jos sulla koskaan on syöpä diagnosoitu. Siinä mielessä tämähän on hirveän otollinen mahdollisuus tehdä koko väestön kattavia tutkimuksia, jossa sä saat kutakuinkin sen koko väestön sen tutkimuksen katseen alle.

RR: Tämä kyseinen tutkimus kertoo -87 ikäluokasta. Kertooko se jotain myös vaikka vuonna -95 syntyneestä ikäluokasta?

AT: Varmasti siellä on yhtäläisyyksiä tai korrelaatioita, jotka merkitsee samoja, mutta täytyy muistaa, että sillä aineistolla, joka silloin kerättiin, on oma konteksti ja oma historiansa. Jotta sä pystyt tulkitsemaan niitä asioita ei välttämättä oikein, mutta syvällisemmin, sun täytyy myös ymmärtää se konteksti, jossa se kohortti on syntynyt, eli 80-luvun loppu, ja sitten siinä on ollut 90-luku, eli silloin on ollut lama. Tämä lama on vaikuttanut merkittävästi näitten ihmisten elämään, eli me tiedetään suurin piirtein, että oliko 20 prosenttia näistä ihmisistä, jotka syntyi -87, kärsii masennuksesta tai on saanut masennusdiagnoosin, kun he on mennyt lääkärille. Tämä johtuu osittain sen takia, että he on kokeneet laman, on ollut taloudellisesti tosi vaikeata. Tietenkin he on käynyt koulujärjestelmän läpi silloin 90-luvulla 2000-luvulla, jolloin ehkä kouluissa ei ollut niin paljon rahaa. Välttämättä sitä historiallista kontekstia ei ole siinä datassa sinänsä, mutta jos sä olet tutkija ja sulla on tällaista eräänlaista datalukutaitoa, sä ymmärrät myöskin sen, mikä auttaa selittämään näitä asioita, että siellä on tällaisia ongelmia. Toki me voidaan ajatella, jos me katsotaan -95 syntyneitä, jotka nyt on 25–26, heillä saattaa olla myös samanlaisia ongelmia, mutta johtuuko nämä ongelmat sitten samoista syistä vai muista syistä. Se liittyy tähän kysymykseen datalukutaidosta, että sä ymmärrät, että se, että kaksi asiaa näyttää numeroissa samalta, se asia, joka selittää sen, saattaa olla hirveän erilainen. Se tietenkin on tutkijan datalukutaidon kannalta tosi tärkeä.

RR: Kuten on monta kertaa puhuttu, datasta puhutaan nykyään ihan hirveästi, vaikka kyllähän dataa on kerätty jo vaikka kuinka kauan. Esimerkiksi Tilastokeskuksen mukaan suomalaisista on tehty tilastoja ainakin 1700-luvulta asti. Miksi data on just nyt niin kuuma aihe?

AT: Raha.

RR: Raha?

AT: Joo. Siitä tuotetaan rahaa. Tämä malli, joka tuli näiden isojen IT-firmojen Google, Facebook myötä, jossa he kerää susta dataa ja sitten he lähtee kauppaa tätä. Tämä taloudellinen moottori, joka pyörii etenkin Yhdysvalloissa tai länsimaissa, jossa myydään dataa eteenpäin, sitä jalostetaan, siitä kerätään tietoja, siitä tehdään profiileja, minkälaisia asioita sä tykkäät ostaa, missä päin kaupungilla sä liikut ja niin poispäin. Tämä on se arvon jalostusjuttu, johon jokainen valtio, jokainen yritys tänä päivänä kutakuinkin haluaa tavalla tai toisella päästä kiinni. Toi oli nyt ehkä vähän kärjistettyä, mutta se on se juttu. Jos me katsotaan 1700–1800-luvun kirkon kirjoja, siellä eivät papit olleet myymässä tätä, sanomassa, että hei tulkaa ostamaan täältä tätä tietoa siitä, kuka meni tässä kunnassa naimisiin viime vuonna kenen kanssa ja niin poispäin.

RR: Eivät tajunneet. Olisi ollut hyvä bisnes sekin.

AT: Niin. Ehkä heillä oli muita asioita. Ehkä heidän prioriteetit oli muualla.

RR: Tämä on musta kiinnostavaa, kun mietitään just tätä tavallaan datan keräämistä ja hyödyntämistä, kun mekin ollaan puhuttu siitä, että sitä kerätään hyvin eri tarkoituksiin ja hyvin eri tahojen kautta. Onko tämä markkina-ajattelu se, joka just erottaa vaikka kaupallisten yritysten datan keräämisen esimerkiksi tästä edellä mainitusta THL:n ja Nuorisotutkimusverkoston tekemästä jättimäisestä kohortista? Onko se se, miten me pystytään sanoo, että nämä pelaa vähän niin kuin eri maaliin sen takia nämä on eri juttu, vaikka kerättäisi itse asiassa täysin samankaltaista tietoa ja dataa?

AT: Kyllä ja ei. Mä tekisin tässä muutamia erotteluja. Ensinnäkin aina kun puhutaan datasta, jota viranomaiset kerää, laki sanoo nimenomaan sen, että siinä täytyy olla joku syy, eli niillä on joku merkitys terveydenhuollossa, korvausmenettelyissä, siinä, että äidit tulee terveystarkastuksiin, että sitten saa lapsirahan maksettua ja niin poispäin, eli sillä on ollut tarkoitus. Nyt tietenkin on myös selvinnyt, että tätä dataa pystyy käyttää muihin kuin mihin se on alun perin kerätty, eli puhutaan niin sanotusta toisiokäytöstä. Sen takiahan meillä myös Suomessa on toisiolaki. Sen takia meillä on myöskin biopankkilaki. Jos me sitten käännetään tämä toisinpäin, ajatellaan tätä sun kannalta, sähän et voi sanoa verottajalle, että hei mä en halua, että sä keräät mun dataa, mä en halua käyttää sun palveluja. Verottajahan nauraisi sulle. ”Anteeksi nyt vain [naurahtelee], tervetuloa Suomeen, mutta täällä toimitaan näin.” Tai jos sulla diagnosoidaan syöpä, sä et voi sanoa, että ”hei mä en halua, että toi data menee tuonne syöpärekisteriin”. Se menee sinne, ja sä et voi päättää siitä. Sitten jos mennään tänne yksityiselle puolelle, ei sulla ole mitään velvollisuutta käyttää Googlen hakukonetta, mutta toki Googlen hakukone on saavuttanut aikamoisen aseman. Lähestulkoon jokainen käyttää sitä.

RR: Ei mulla ole velvollisuutta...

AT: Sulla ei...

RR: ...mutta mitkä on realistiset mahdollisuudet etsiä tietoa jotain muuta kautta.

AT: Kyllä.

RR: Hankalat.

AT: Mä käytän toista hakukonetta kannettavalla DuckDuckGo. Jos mä teen haun yhdellä koneella, jossa on Google versus DuckDuckGo, ne tulokset on erilaisia, eli meidän täytyy myös ymmärtää, että se tulos siinä, kun meillä on jonkinlainen interaktio sen yrityksen kanssa, on erilainen riippuen siitä, miten he kerää sitä dataa, miten paljon ihmisiä käyttää heidän palveluita, minkälaisia algoritmeja heillä on siellä, mitkä päättää sen, mitä he haluaa, että sä näet. Sun täytyy ymmärtää, että Google on yritys, joka haluaa myydä sun tietoja, mutta se haluaa myös myydä sinulle tietoa, eli kaikissa Google-hauissa on mainoksia ne ekat neljä viis riviä, eikö vain. Se pointti tässä on se, että kun valtio pystyy keräämään tietoa kattavasti koko väestöstä kuta kuinkin, yrityksillä tämä ei ole sama juttu. Toki meillä on näitä tosi isoja yrityksiä, joilla on paljon käyttäjiä, ja sen kautta heille tulee luotettavuutta ja niin poispäin, mutta sä pystyt astuu siitä pois.

RR: Otetaan lisää esimerkkejä.

AT: Joo.

RR: Koska vaikka tällaisia valtion tai viranomaisen tai jonkun muun julkistahon instituution datan keruuta on ehkä helpompi pitää eettisenä ja turvallisena, siihenkin voi liittyä omat sudenkuoppansa. Esimerkiksi terveydenhuollossa käytetyt potilastietojärjestelmät, niistä varmaan surullisen kuuluisimpana Apotti-järjestelmä, jonka käyttöönotossa on ollut jos jonkinmoista vaihetta. Miten sä Aaro katsot Apottia? Millaisena Apotti sun mielestä näyttäytyy datan keruun ja hyödyntämisen näkökulmasta?

AT: Joo, Apottihan on hirveän mielenkiintoinen hanke. Se on erittäin suuri. Se on monessa mielessä aika tyypillinen hanke silleen, että siihen on liitetty paljon oletuksia siihen, mitä se pystyy tekemään. Jos me ajatellaan Apottia, tämä perustuu Epicin järjestelmään, joka on kansainvälinen IT-alan toimija, joka toimittaa nimenomaan tällaisia alustoja terveydenhuoltojärjestelmälle. Kun he toimittaa tämän alustan, heillä on tietenkin eräänlaisia rakenteellisia juttuja siinä heidän järjestelmässä, jotka ohjaa myöskin sitä, mitä hoitaja tai lääkäri joutuu tekemään hoitotyössään, eli miten he joutuu käyttää sitä järjestelmää. Mä en ole Apotti-asiantuntija, mutta mä sanoisin, että siellä on paljon asioita, joissa tietoa sinne Apotti-järjestelmään täytyy syöttää rakenteellisesti, eli sulla on jotain koodeja, joita sä valitset sinne, jolloin lääkäri klikkaa sitä ja tätä ja tuolleen. Jos sä katsot esimerkiksi hoitajien työtä jokapäiväisessä sairaalassa tai tuolleen, hyvin paljon heidän työ on sitä, että heidän pitää kirjoittaa vapaa tekstiin selityksiä sille seuraavalle hoitajalle seuraavassa vuorossa, että hän ymmärtää, mitä oikeasti on tapahtumassa sen potilaan kanssa. Tämä on yksi hyvä esimerkki siitä, miten joku järjestelmä tai ajattelu siitä, miten me tuotetaan tietoa esimerkiksi päätöksentekijöille, alkaa aiheuttaa kitkaa käytännön työssä, jota siellä kentällä tehdään [naurahtaa], jolloin ne käyttäjät, jotka yrittää saada sen tiedon siitä, että okei tämä potilas on voinut vähän huonommin nyt, me annettiin tätä ja tätä, ei voi hyvin, että se tieto, se fluidi tieto, se ei-rakenteellinen tieto kulkeutuu sille seuraavalle henkilölle.

Tässä Apotti on hyvä esimerkki silleen, että se Epic-järjestelmähän on alun perin Yhdysvalloista, ja se idea siellä takana on, miten me laskutetaan jokaisesta toimenpiteestä. [naurahtaa] Jokaiselle toimenpiteelle, kun sä menet sairaalaan tai lääkäriin, täytyy olla joku koodi ja se, miten se laskutetaan sillä potilaalla. Tietenkin kun sä menet lääkäriin täällä terveyskeskukseen, se ei ole se, miten meillä toimitaan. Siinä mielessä siinä on paljon sellaista funktionaalisuutta, joka ei istu lainkaan tähän suomalaiseen terveydenhuoltojärjestelmään.

RR: Tässä on selvästi aika paljon kyse siis ei tavallaan vain siitä, mitä kaikkea dataa vaikka potilastietojärjestelmässä tai koulussa Wilmassa vähän niin kuin olisi tarjolla, vaan myös siitä, kuka tai millainen ihminen on myös sen tiedonkeruujärjestelmän suunnitellut, ja millaisia tarkoitusperiä hän on sitä suunnitellessa ajatellut.

AT: Ilman muuta. Niin kuin mä sanoin, silloin kun me ajatellaan dataa ja mistä data tulee ja minkä takia se tulee, täytyy myös muistaa, että kun se Epic on kehitetty, sitä on alun perin haluttu kehittää siinä, että se laskutus toimii siinä saumattomasti. Eli siinä mielessä se ajatus, se filosofia on ohjannut sitä koodaamista, sitä koko arkkitehtuuria siellä, joka sitten toimii. Nyt kun sitä sovitetaan Suomeen, tietenkin siinä on ollut omia haasteita ja niin poispäin. Jossain mä luin jotain esimerkkiä, että oli joku turhautunut jossain sairaalassa ja sanonut, että kun he halusi muuttaa jonkun kategorian nimeä, että se vastaisi paremmin sitä, mitä he tekee siellä, mutta Epicistä vastattiin, että ei, sitä ei voi muuttaa, koska se kategoria on se sama kaikissa niitten järjestelmissä, ja kun se on kaikki siellä, se täytyy olla sama täällä. [naurahtaa] Siinä näkee sen, että vaikka on puhuttu siitä, että tätä voidaan kustomoida ja tehdä just tarpeiden mukaan, siellä on paljon sellaisia asioita, jotka on päätetty muualla muilla perusteilla, [rauhallinen musiikki alkaa soida taustalla] ja niitä ei välttämättä saada sitten istumaan just siihen. Se tarkoittaa sitä, että käyttäjien Suomessa täytyy muuttaa toimintatapojaan, että se järjestelmä toimisi.

[rauhallista musiikkia]

RR: Aaro, jos susta tehtäisiin patsas tai vaikka semmoinen rintakuva, mihin haluaisit, että se laitetaan näytille?

AT: Ensinnäkin mä pyytäisin, että musta ei tehdä patsasta.

RR: Miksi?

AT: Se on niin kylmä, eloton. Mä pyytäisin, että istutettaisi puu tai puita jonnekin.

RR: Okei.

AT: A ne puhdistaisi ilmaa, B 30 vuoden päästä niiden alla voisi istua tai laittaa riippukeinun roikkumaan sinne, ja joku voisi nauttia elämästä, miettiä asioita, pohtia, minkä takia elämä on tällaista. Mun mielestä se olisi paljon kivempi kuin joku patsas.

RR: Missä tämä Aaron metsä tai Aaron puu sijaitsisi?

AT: Ehkä sellaisessa paikassa, jossa on vain tyhjä parkkipaikka...

RR: Kova.

AT: ...hiekkakenttä tai sellainen. Se muuttaisi asiaa. Mä muistan nuorena mä elin New Yorkissa, ja siellä oli sellainen ryhmä ihmisiä kuin Green Guerillas. New Yorkissa 80-luvulla oli paljon tyhjiä tontteja, jotka näytti ihan kauhealta. Se, mitä ne teki, ne meni näille tonteille ja ne alkoi istuttelee juttuja: puita, pensaita, kasveja, kaikenlaisia hyötykasveja. Sitten parin vuoden päästä siinä rehottikin tosi kaunis pieni puisto, eli mikä tahansa tällainen paikka, joka ei näytä kivalta, ei näytä houkuttelevalta, ihan mihin tahansa, se olisi se.

RR: Tässä olisi myös siis tämmöinen vähän niin kuin valtaamisen ja haltuun ottamisen ehkä jopa anarkistinen tematiikka, että mennään jonnekin, mikä on jotain ankeaa asvalttia ja autoja varten, ja sinne tehdään Aaron keidas.

AT: Joo, mä en koe itseäni anarkistina, mutta kyllä mä olen valmis joustamaan tämän verran tässä.

RR: Tuon verran. Sen verran, että puu menee parkkipaikalle.

AT: Kyllä.

RR: Se hippunen anarkiaa. Maailman kulunein ja väsynein fraasi tutkijoista liittyy jonkinlaiseen kököttämiseen tutkijan kammiossa. Se ei mitenkään siis vastaa todellisuutta, mutta jos sulla oikeasti olisi ihan oma kammio, mitä siellä olisi?

AT: Oi, siellä olisi mukava tuoli.

RR: Tärkeä.

AT: Siellä olisi mahdollisuus keskustella muiden kanssa, eli siellä olisi paljon mukavia tuoleja, riippukeinu. Mä tykkään niistä paljon. Niissä syntyy parhaat ideat ja parhaat pohdinnat. Eli se olisi tila, jossa ei tarttisi olla yksin, voi keskustella. Tutkijana mä olen todennut, että silloin kun joutuu kirjottaa jotain yksin, se on jokseenkin hieman rasittava ja tylsä prosessi, koska silloin mä puhun lähinnä vain itseni kanssa. Mä olen nyt tässä 49 vuotta puhunut itseni kanssa aika paljon ja mä tunnen itseni [nauravat].

RR: Nyt riittää.

AT: Se on paljon kiinnostavampaa jutella muiden kanssa ja oppia asioita ja kirjoittaa ihmisten kanssa uusia asioita, jotka myös haastaa niitä omia ajatuksia ja mielipiteitä. Sellainen olisi se ja se ei olisi kammio. Se olisi sellainen mesta.

RR: Mesta. Mikä on tieteen historiassa hetki, missä sä olisit halunnut olla mukana esimerkiksi osana tutkimusryhmää tekemässä jonkinlaista löydöstä?

AT: [naurahtelee] Ei mulla ole tällaisia fantasioita, että jossain haluaisi olla mukana. Kyllä tämä nykyhetki on se paras hetki.

RR: Et olisi halunnut olla siellä, kun ensimmäinen valo syttyy sähkön avulla tai ekaa kertaa kokeillaan jotain geenisaksia ja saadaan nipsastua?

AT: Ei, koska se ei ole välttämättä edes sellainen hetki, että nyt heureka. Siinä on paljon kokeilua. Me ollaan hirveän selektiivisiä myöskin siitä, mitä me nähdään tieteellisenä voittokulkuna. Se, että me saadaan jotain toimimaan, monesti se on vuosien työ. Se ei ole vain sellainen yksi heureka-hetki, vaan oikeasti se rakentuu vuosikymmenien päälle ja muiden tutkijoiden tuloksiin ja niin poispäin. Jos sellaisia hetkiä olisi, mikäs siinä, mutta se on prosessi. [rauhallinen musiikki alkaa soida taustalla] Nyt on paras hetki elää.

RR: Aaro Tupasela, kiitos kun olit mukana Utelias mieli -podcastissa.

AT: Kiitoksia.

[rauhallista musiikkia]

RR: Kiva kun kuuntelit Utelias mieli -podcastia. Löydät sen Spotifysta, Apple Podcasteista ja SoundCloudista.

[rauhallista musiikkia]