Apua datan hallintaan – uudet aineistokäsikirjat käyttöön

Monipuolistuvat datavirrat avaavat SSH-aloille koko ajan uusia horisontteja. Samalla aineistojen hallinnan taidot ja tuki korostuvat.

Helsingin yliopiston humanistis-yhteiskuntatieteellinen instituutti (HSSH) ja Helsingin yliopiston Datatuki kehittivät yhteisprojektissa mallin, jossa yleiset datan hallinnan periaatteet ja ohjeet jalkautettiin lähemmäs tutkijoiden, opettajien ja opiskelijoiden käytännön pulmia ja niiden ratkomista. Hankkeen ensimmäisenä konkreettisena tuotoksena valmistui aineistonhallinnan käsikirjoja viidelle erityisesti SSH-aloilla käsiteltävälle aineistotyypille. Aineistokäsikirjat -kokonaisuus on kasvava ja elävä, datan hallinnan työnkuluissa neuvova tietoresurssi. 

Aineistokäsikirjat syntyivät tarpeesta auttaa tutkijoita soveltamaan aika ajoin abstrakteja tai yleiselle tasolle jääviä ohjeita käytännön työssä. Erityiseksi ongelmaksi hankkeessa tunnistettiin se, että yleisten ohjeiden soveltaminen vaatii sekä aineistotyypin että tutkimusalan kontekstin huomioonottamista. Käsikirjat pyrkivätkin porautumaan aineistotyyppien erityiskysymyksiin eri tutkimuskonteksteissa.

Tyypillisenä esimerkkinä aineistojen soveltamisen monimutkaisesta luonteesta voidaan mainita haastattelututkimus. Haastattelututkimusaineisto vaatii varsin erilaisia toimenpiteitä riippuen niistä menetelmistä, joilla aineistoa aiotaan käsitellä tai tavoitteista, joita tutkimuskysymyksillä pyritään tavoittamaan. Haastattelu lääketieteellisessä tutkimuksessa vaatii aivan erilaisia käsittelytoimia kuin haastattelu historiallisena muistitietoaineistona. 

Useassa tapatuksessa aineiston käsittely kytkeytyy erottamattomasti tieteenalan menetelmälliseen ja epistemologiseen perustaan. Datatuen asiantuntijat tuntevat huonosti eri tieteenalojen konventioita ja tutkimustehtävien tavoitteita. Tutkijat puolestaan tuntevat huonosti aineiston ja datan hallinnan hyviä käytänteitä ja vaatimuksia. HSSH:n ja Helsingin yliopiston Datatuen hankkeen tavoitteena oli nimenomaan tutkia näiden toimijoiden vuorovaikutusta ja kartoittaa mahdollisuuksia tehostaa yhteistyötä. Tähän tavoitteeseen pyrittiin pääsemään prosessilla, jossa datanhallinnanasiantuntija ”tutkivat” tutkijoiden aineiston käsittelyn työnkulkuja. Primäärinä aineiston keruumenetelmänä käytettiin haastattelua ja havainnointia, eli datanhallinnanasiantuntijat seurasivat tutkijoiden työtä käytännön tasolla ja tekivät aihetta kartoittavia puolistrukturoituja teemahaastatteluja tutkijoiden kanssa. Tämän jälkeen kerätystä aineistosta tuotettiin aineistokäsikirjojen ensimmäiset versiot, joita kommentoimaan kutsuttiin kunkin aineistotyypin parissa työskenteleviä tutkijoita. 

 ”Aineiston keräämisen, käsittelyn ja säilyttämisen ratkaisut riippuvat aina siitä, millaista dataa tarvitaan. Käsikirjojen ajatuksena on kiinnittää datahallinnan kysymykset käytännön läheisesti erilaisiin aineistoihin”, sanoo projektia koordinoinut datatuen tietoasiantuntija ja musiikkitieteen yliopistonlehtori Mikko Ojanen. 

Ensimmäiset viisi käsikirjaa ovat olleet suomenkielisinä luonnoksina kommentoinnissa ja koekäytössä kevään aikana. Ne perehdyttävät kyselyaineistoihin, somedataan, tutkimuskäyttöön jalostettaviin tekstiaineistoihin, rekisteriaineistoihin sekä video- ja äänitallenneaineistoihin. Käsikirjat julkaistaan myös englannin ja ruotsin kielellä syyslukukauden alussa.

”Nyt julkaistut versiot kehittyvät jatkossa saadun palautteen ja kentän muutosten kautta. Olemme myös tuottamassa lisää oppaita, ainakin haastattelututkimuksen, etnografian ja kokeellisten mittausdatojen erityiskysymyksistä”, kertoo HSSH:n johtaja Risto Kunelius.

Nopeasti kehittyvä SSH-alojen datamaisema haastaa myös opetusta.

”Kehittyvä käsikirjaperhe tukee myös nykyaikaisten tutkijantaitojen opetusta. Oppaat ovat hyödyllisiä myös opiskelijoille, joiden on niin opinnäytteissään kuin tulevissa töissään ymmärrettävä vastuullisen datahallinnan perusteet”, Ojanen sanoo. 

Datatuella on yli 10 vuoden kokemus aineistonhallinnan koulutuksen järjestämisestä. Haasteeksi oikea-aikaisen opetuksen ja opintopolkuun sopivasti skaalautuvien osaamistavoitteiden toteutuksessa on osoittautunut tukipalveluiden ja tutkimus- ja opetuskentän puutteellinen vuorovaikutus. Myös tähän haetaan ratkaisua HSSH:n ja Datatuen hankkeen jatkosuunnitelmilla. Datatuen tarjoama koulutus tunnetaan yliopistolla verrattain huonosti ja toisaalta tutkijat ja opiskelijat tunnistavat heikosti, missä kohdassa he apua tarvitsevat. Ongelmaan yritetään etsiä ratkaisua integroimalla aineistonhallinnan koulutus entistä selkeämmin nyt päivitettäviin opetussuunnitelmiin. 

Vuonna 2026 alkava uusi opetussuunnitelmakausi antaa mainion tilaisuuden sijoittaa aineistonhallinnan opetus osaksi geneeristen akateemisten taitojen opetusta. Ongelma on tunnistettu myös keväällä 2024 valmistuneessa Helsingin yliopiston datapolitiikan keskustan viiden tiedekunnan yhteisessä toimeenpanosuunnitelmassa, jossa tiedekunnat tunnistavat ja tunnustavat aineistonhallinnan geneerisenä akateemisena ja ensiarvoisen tärkeänä työelämätaitona. 

”Tästä näkökulmasta aineistonhallinnantaidot voisi rinnastaa tieteellisen tiedonhankinnan ja lähdekritiikin, tieteellisen kirjoittamisen sekä tutkimusetiikan taitoihin”, toteaa Ojanen.

Työ aineistonhallinnan opetuksen integroimiseksi tulevan opetussuunnitelmakauden 2026–2029 sisältöihin aloitetaan syyskaudella 2024 yhteistyössä Datatuen, HSSH:n, tiedekuntien koulutussuunnittelijoiden ja Opetuksen strategisten palveluiden kanssa.  

Lii­ty Hes­sun ys­tä­viin ja saat uu­tis­kir­jeen suo­raan säh­kö­pos­tii­si!

Ohjeet Hessun ystäviin liittymiselle löytyvät täältä.