Olen Iina Hepolehto ja työskentelen tietoasiantuntijana Helsingin yliopiston kirjaston datatiimissä. Pääasiallisiin tehtäviini kuuluu tutkijoiden neuvominen aineistonhallintaan liittyvissä asioissa eli miten tutkimusaineistosta pidetään huolta ja miten varmistetaan, että data on turvassa ja pysyy laadukkaana. Vastuullani ovat erityisesti lääketieteellinen aineisto ja Meilahden kampuksen tutkijat.
Helsingin yliopiston kirjastossa olen työskennellyt nyt kaksi ja puoli vuotta. Haaveilin jo nuorena kirjastossa työskentelystä mutta sitten päädyin opiskelemaan mikrobiologiaa. Olin kuitenkin puhunut tästä haaveestani tuttavilleni, joten kävi niin, että aloiteltuani väitöskirjaa mikrobiologian alalla kaksi tuttavaani, ihan toisistaan tietämättä, lähetti minulle linkin tähän kirjaston datatiimin työpaikkailmoitukseen. Ajattelin, että tämä olisi kuin juuri minulle tehty, koska olin opiskellut myös informaatiotutkimuksen perusteita.
Vaikka aloitin työssä kesken koronapandemian vaihtoehdottoman etätyön enkä nähnyt useimpia tiimissäni ensimmäiseen puoleen vuoteen livenä lainkaan, olen päässyt kirjaston työyhteisöön hyvin sisään. Perehdytys oli niin hyvin suunniteltu. Sen sijaan tutkijaverkostoja on täällä Meilahden kampuksella ollut etätyönä työläämpää rakentaa.
Aineistonhallintasuunnitelmien taustalla se iso tavoite on tieteen avoimuus ja se, että tutkijat pystyisivät mahdollisesti avaamaan datansa. Vaikka lääketieteen aloilla itse aineistot eivät useinkaan voi olla avoimesti saatavilla, olisi tärkeää, että tutkija pystyisi mahdollisimman tarkasti kuvaamaan minkälaisia tutkimusta on tehty ja minkälaisia tutkimusaineistoja on käytetty ja syntynyt siinä prosessissa.
Aineistonhallintasuunnitelmassa tutkija miettii järjestelmällisesti sitä miten hän aineistoa kerää, missä muodossa aineisto on, minkälaisia sopimuksia aineiston keräämiseksi pitäisi tehdä, tai käytetäänkö esimerkiksi jonkun toisen keräämää dataa. Lisäksi on tietosuojaan ja tietoturvaan liittyviä asioita, eettisiä kysymyksiä, jotka pitää ottaa huomioon. Ja vaikka se, joka kerää datan omistaa sen datan, siitäkin pitää tehdä sopimukset, miten sitä dataa vaikka tutkimusryhmässä käytetään.
Sitten on tietenkin tallennukseen liittyviä kysymyksiä. Tutkijan kanssa käydään läpi se, minkälainen tutkimusaineisto on, ja mihin se kannattaa tallentaa, ettei se korruptoidu tai mene rikki. Tässäkin tietoturva ja tietosuoja ovat ihan olennaisia kysymyksiä. Viimeinen osa aineistonhallintasuunnitelmaa on datan pitkäaikaisen tallennus johonkin sopivaan paikkaan tai niiden datojen avaaminen ja julkaiseminen. Samalla mietitään, kuinka paljon rahaa ja aikaa aineiston keräämiseen, käsittelyyn, tallentamiseen tai avaamiseen tarvitaan.
Tutkija tekee aineistonhallintasuunnitelman itse, mutta me kirjaston datatiimissä autamme, jos siellä on aukkokohtia tai avoimia kysymyksiä. Usein se aineistonhallintasuunnitelmien kommentointi on vähän sellaista rivien välistä lukemista, esimerkiksi tutkija ei aina itse huomaa missä hänellä on henkilötietoja tai sensitiivistä dataa ja tiedä, miten sen kanssa pitäisi toimia.
Tieteen avoimuus on tutkimuksen edellytys. Se että julkaisut ja datat ovat avoimia vie tutkimusta eteenpäin globaalisti ja toivon mukaan siinä säästetään myös resursseja. Samalla tieteen avoimuus tukee kestävää kehitystä. Se, että datat olisivat avoimia olisi tosi tärkeää, koska silloin olisi mahdollista globaalisti yhdistää tietoa. Dataa syntyy myös jatkuvasti hirvittävän suuria määriä, alkaa olla jopa ongelma, että miten sitä kaikkea dataa hyödynnetään.
Datatiimin työ näkyy yliopistolaisten arjessa myös niin, että datatukiverkosto pyrkii tarjoamaan erilaisia työkaluja datan keräämiseen ja tallentamiseen. Esimerkkeinä vaikkapa REDCap-työkalu, jolla voi kerätä sensitiivistä dataa tai DMPTuuli-työkalu, jolla voi tehdä sitä aineistonhallintasuunnitelmaa. Työssäni myös koulutan paljon datanhallintaan liittyvissä kysymyksissä esimerkiksi erilaisissa infotilaisuuksissa laitoksilla.
Meille tulee näitä tutkijoiden kysymyksiä päivittäin palveluosoitteeseen, ja usein minulla on 3-5 tutkijan keissiä yhtä aikaa kesken. Useinkaan ei kinkkisimpiin kysymyksiin pysty yksin vastamaan, vaan me teemme Helsingin yliopiston datatukiverkostossa tiivistä yhteistyötä tietotekniikkakeskuksen, tutkimushallinnon ja -rahoituksen sekä juridiikan asiantuntijoiden kanssa. Datapalveluiden kehittämisessä tehdään myös paljon kansallista ja kansainvälistä yhteistyötä, Suomessa muiden yliopistojen ja mm. CSC:n kanssa.
Itse toivoisin että tutkijat voisivat meritoitua paremmin myös data-aineistojensa avulla. Monet tekevät data-intensiivistä tutkimusta, eivätkä samalla tavalla ehdi tehdä analyyseja tai julkaista. Olisi hienoa, jos myös datan keräämiseen ja dokumentointiin keskittyvä tutkimus meritoisi tutkijaa, koska tavoitehan on, että data olisi mahdollisimman laadukasta ja hyvin kuvailtua. On myös tärkeää, että vältetään esimerkiksi tietosuojaan liittyviä rikkeitä ja riskejä, jotta datan käyttö olisi mahdollista ja helppoa.
Kun vastaamme palveluosoitteessa tutkijoille, yritän vastata myös kysymyksiin, joita tutkijat eivät välttämättä osaa esittää. Itse tiedän, miten tiukkaa se tutkijan arki on, joten toiveeni työssä on, että pystyisin säästämään tutkijoiden vaivoja jos jonkinmoiselta selvittelyltä.
Kun olin ollut täällä töissä ihan vasta pari kuukautta, yliopistopalveluilla oli iso asiakaskysely, missä kirjasto oli myös mukana. Siinä palautteessa avoimissa vastauksissa yksi tutkija kiitti minua avusta ihan nimeltä mainiten. Se lämmitti mieltä todella paljon. Vaikka olin vasta aloittanut tuli sellainen tunne tai varmuus, että olen ihan oikeassa paikassa.
Sarjassa kirjaston asiantuntijat kertovat työstään #tiedonvoimalla.yliopistoyhteisössä. Tutustu sarjan muihin osiin