Aineistonhallinta
Helsingin yliopiston Datatuki tarjoaa tukipalveluita aineistonhallintaan ja sen suunnitteluun koko tutkimuksen elinkaaren ajalle. Autamme datan järjestämiseen, tallentamiseen ja jakamiseen liittyvissä kysymyksissä sekä juridisissa asioissa.
Aineistonhallinnan suunnittelu ja ohjeet

Aineistonhallintasuunnitelmassa kuvataan, kuinka tutkimusaineistoja* hallitaan tutkimusprojektin aikana ja projektin aktiivivaiheen jälkeen. Sitä on päivitettävä tutkimusprojektin edetessä. FAIR-lyhenne kiteyttää aineistonhallinnan tavoitteet. Aineiston on tarkoitus olla löydettävissä (Findable), saavutettavissa (Accessible), yhteentoimiva (Interoperable) ja uudelleen käytettävissä (Re-usable).

*Sanoilla tutkimusaineisto ja tutkimusdata voidaan tarkoittaa eri asioita erilaisissa yhteyksissä ja ne voidaan ymmärtää myös synonyymeinä (Helsingin yliopiston tutkimudatapolitiikka, 2021).

Aineistonhallintasuunnitelma on osa tutkimussuunnitelmaa. Päällekkäisyyksien välttämiseksi voit viitata aineistonhallintasuunnitelmassa tutkimussuunnitelmaan ja päinvastoin. Aineiston analysointi ja käytetyt menetelmät kuvataan tutkimussuunnitelmassa.

Tutkimusaineiston hallinta ja suunnittelu kuuluu olennaisesti hyviin tutkimuskäytäntöihin. Tavoitteena on

  • tunnistaa ja hallita riskejä,
  • huomioida riittävä tietosuoja ja tietoturva,
  • sopia aineiston tekijyydestä, käytöstä ja säilyttämisestä, sekä
  • varmistaa tarvittavat resurssit ja välineet.

Aineistohallintasuunnitelmassa tutkimusaineistoksi (tutkimusdata) katsotaan

  • kerätty aineisto (kuten näytteet, kyselyt, haastattelut, mittaukset, arvioinnit, kuvantamismenetelmät);
  • tuotettu aineisto (esimerkiksi analyysissä syntyvä aineisto);
  • muut lähteet (kuten arkistomateriaali);
  • muistiinpanot ja kenttäpäiväkirjat sekä
  • lähdekoodit ja ohjelmistot.

Aineistonhallintasuunnitelman laatiminen

  • Tutustu ensin kaikkiin kysymyksiin!
  • Aineistonhallintasuunnitelma täydentää tutkimussuunnitelmaasi. Päällekkäisyyksien välttämiseksi voit viitata suunnitelmasta toiseen.
    • Tutkimussuunnitelma kuvaa aineiston tieteellistä, analyyttistä ja metodologista käsittelyä.
    • Aineistonhallintasuunnitelma kuvaa aineiston teknistä ja hallinnollista käsittelyä.
  • Suunnitelma osoittaa, että osaat tunnistaa ja ennakoida aineistonhallintaan liittyviä riskejä ja ottaa lainsäädännön huomioon.
  • Noudata organisaation tai rahoittajan vaatimuksia.
  • Vastaa ainakin pääkysymyksiin. Jos jokin kysymys ei liity tutkimukseesi, perustele, miksi näin on.
  • Vaikka suunnitelma on rahoittajan vaatimus, se on parhaimmillaan käytännönläheinen ja helposti ymmärrettävä työdokumentti itselle ja kollegoille.
  • Liitä suunnitelmaan mukaan kaikki olennaiset taustatiedot kuten hakijoiden ja hankkeen nimet, numerotunnisteet ja versiotiedot.

Aineistonhallinnan ohjeet

Alla ovat Helsingin yliopiston aineistonhallinnan ohjeet, jotka tarkentavat kansallisia ohjeita. Kansalliset aineistonhallinnan ohjeet ovat DMPTuulissa ja Zenodossa.   Voit hyödyntää DMPTuulia aineistonhallintasuunnitelmasi tekemiseen. DMPTuulissa ovat kaikki aineistonhallinnan ohjeet.

Tutkimusaineisto

Käsittele vastauksessasi seuraavia asioita:

  • Mitä aineistoa tutkimuksessa käytetään ja tuotetaan? Jos käytät arkaluonteista tietoa, katso kohta: Arkaluonteiset ja luottamukselliset aineistot.
  • Missä tiedostomuodoissa aineiston eri osat ovat?
  • Arvioi aineiston yhteenlaskettu koko, esimerkiksi gigatavuina, sekä otoskoko.
  • Käytättekö erityisiä ohjelmia tai kehitättekö omia?

Hyviä käytäntöjä

Luettele datatyypit listana tai taulukkona esimerkiksi alla olevien luokittelujen mukaisesti. Suunnitelma pohjautuu kuvattuihin datatyyppeihin, ja jos käytät kategorisointia tai lyhenteitä datayyppien kuvailussa, sinun on helpompi viitata datoihin suunnitelman loppuosassa. 

Esimerkki datatyypeistä listamuodossa:

1. Tutkimusta varten kerättävä aineisto

  • Kysely aiheesta x, tiedostomuoto .pdf, koko 5 Gt
  • DNA-näyte (erittele näytteen alkuperä - ihminen vai muu eliö), fyysinen näyte, koko n=500
  • Kuvat/videot aiheesta x, tiedostomuoto .jpg, .avi, koko 1 Tt

2. Tutkimusprosessin tuloksena syntyvä aineisto

  • Kyselyaineiston analyysit, .pdf, .xlsx, 2 Gt
  • DNA sekvenssi/analyysi, FASTA, .txt, .xlsx, 2 Tt
  • Aineiston dokumentaatioaineisto (kyselylomake, koodikirja, laboratoriopäiväkirja, readme-tiedostot)

3. Aiemmin kerätty aineisto 

  • Näytteet Biopankista
  • Tilastokeskuksen aineisto x, tietokanta, 10 Gt
  • Kyselyaineisto Tietoarkiston Aila-tietokannasta
  • Haastatteluaineisto tai kielikorpus Kielipankista

Koska tutkimusaineiston arkaluonteiset osat sisältävät erityisen paljon riskejä, niiden tunnistaminen ja hallinnointi vaatii erityistä tarkkuutta. Henkilötietojen osalta kerro, mikä taho toimii rekisterinpitäjänä. Lisätietoja Tutkijoiden tietosuojaohjeessa (Flamma) sekä Täydentävästä ohjeesta arkaluonteisen datan hallintaan.

Arkaluonteinen ja luottamuksellinen tieto on sellaista, joka voi paljastuessaan aiheuttaa vahinkoa. Tällaisia aineistoja ovat esimerkiksi:

  • Henkilöitä koskevat tiedot:
    • Henkilötietoa ovat kaikki ne tiedot, joista henkilö on tunnistettavissa joko suoraan tai epäsuorasti
    • suorat tunnisteet: nimi, puhelinnumero, henkilötunnus, kuva, ääni, sormenjälki, hammaskartta
    • epäsuorat tunnisteet: sukupuoli, ikä, koulutus, ammattiasema, kansallisuus, sijainti, työhistoria, järjestelmän lokitiedot, sivilisääty, asuinpaikka, auton rekisterinumero, mielipide, psyykkinen tai fyysinen ominaisuus
  • Arkaluonteiset henkilöä koskevat tiedot:
    • Erityiset henkilötietoryhmät:
      • tiedot, joista ilmenee rotu tai etninen alkuperä, poliittisia mielipiteitä, uskonnollinen tai filosofinen vakaumus tai ammattiliiton jäsenyys 
      • geneettiset tiedot 
      • biometriset tiedot, jos niitä käsitellään teknisin menetelmin henkilön yksiselitteistä tunnistamista varten 
      • terveyttä koskevat tiedot
      • luonnollisen henkilön seksuaalista käyttäytymistä ja suuntautumista koskevat tiedot.
    • Muut sensitiiviseksi koetut henkilöä koskevat tiedot: 
      • Taloudellinen tai sosiaalinen status
      • Henkilön sijainnin seurantatiedot
      • Viestintä
      • Käyttäytyminen
      • Muut erityisen henkilökohtaisiksi koetut tiedot esim. muistiinpanot, päiväkirjat
  • Sensitiivinen lajitieto, kuten uhanalaiset eläimet ja kasvit, luonnonsuojelullinen tieto tai bioturvallisuusuuteen liittyvä tieto.
  • Muu luottamuksellinen tieto, kuten patentit, maanpuolustukseen liittyvä tieto, organisatorinen tieto tai liikesalaisuudet.

Tuo esille piilevät riskit aineiston yhtenäisyyden ja laadun varmistamisessa ja se, miten riskejä kontrolloidaan. Huomaa, että aineiston laatu ja tutkimusmenetelmän laatu tarkoittavat eri asioita.

Hyviä käytäntöjä

Kerro esimerkiksi seuraavista käytännöistä: 

  • Mitä aineistonhallinnan työkaluja sinulla on käytössäsi, kuten tietokantapohja, elektroninen laboratoriopäiväkirja tai sähköinen kyselylomake?
  • Miten aineistoa käsittelevät henkilöt perehdytetään?
  • Ovatko käytettävät menetelmät validoituja, tai onko käytössä laatukäsikirja?
  • Tarkistaako joku äänitettyjen tai kuvattujen haastattelujen litteroinnin?
  • Käytättekö tarkistussummia?
  • Vastaavatko digitoidut aineistot riittävän tarkasti alkuperäisiä fyysisiä tai analogisia aineistoja?
  • Varmistetaanko alkuperäisen tietosisällön säilyminen, jos tietoja siirretään, muutetaan tai konvertoidaan järjestelmästä toiseen?
  • Pohdi, miten mahdollinen minimointi, pseudonymisointi tai anonymisointi vaikuttavat aineiston laatuun.
Eettiset periaatteet ja lainsäädäntö

Käsittele vastauksessasi seuraavia asioita:

  • Sisältääkö aineistosi henkilöihin liittyvää tietoa?
  • Liittyykö aineistoosi yleisissä tai tieteenalakohtaisissa tutkimuseettisissä ohjeistuksissa linjattuja näkökohtia?
  • Tarvitseeko tutkimuksesi eettisen ennakkoarvioinnin, joka tehdään tarvittaessa aina ennen aineistonkeruun aloittamista?
  • Millaisia tutkimus- tai viranomaislupia tarvitset? Esim. Findatan tietolupa, kohdeorganisaation tutkimuslupa?
  • Käsitteletkö muuta salassa pidettävää tai luottamuksellista aineistoa kuin yllämainitut (esim. sensitiivinen lajitieto, suojelualueet, asevoimiin liittyvä tieto)?
  • Liittyykö aineistoon tekijänoikeus- tai patentointikysymyksiä?

Kerro, miten täytät eettiset vaatimukset ja noudatat asiaankuuluvaa lainsäädäntöä tutkimusaineiston hallinnassa. Kuvaa myös tärkeimmät riskit ja kuinka hallitset niitä.

  • Perustele, että sinulla on oikeus kerätä, käsitellä ja säilyttää aineistoa, joihin liittyy eettisiä seikkoja. Esim. kerro, onko mahdollinen eettinen ennakkoarviointi tehty ja kuvaile, miten pyydät mahdollisilta tutkittavilta tietoon perustuvat suostumukset tutkimukseen osallistumiselle.
  • Jos käsittelet henkilötietoja:
    • Kuvaile, miten keräät aineiston ja huomioit tietosuojan
      yleiset periaatteet:
      • Mikä on käsittelyperuste (yleensä yleisen edun mukainen tieteellinen tutkimus)
      • Miten informoit tutkittavia? (Avoimuus tutkittavia/tutkimushankkeeseen osallistuvia kohtaan.)
      • Mitkä henkilöihin liittyvät tiedot ovat tarpeellisia ja miksi (minimointiperiaate) ja kerro miten tarvittaessa anonymisoit tai pseudonymisoit aineiston.
      • Huomioi, että aineistoja käytetään vain niihin tarkoituksiin joihin ne on kerätty ja mitä tutkittaville on mahdollisesti informoitu
      • Huolehdi siitä, että tietoja ei sälytetä kauempaa kuin on tarpeen (pseudonymisointi, anonymisointi, tietojen tuhoaminen) ja mitä aineistolle tapahtuu tutkimuksen päättymisen jälkeen
    • Arvioi, mitä riskejä henkilötietojen käsittelystä voi aiheutua tutkittaville ja kuvaile miten ne vältät? Mikäli tietojen käsittely saattaa aiheuttaa korkean riskin tutkittaville, on sinun tehtävä myös tietosuojaa koskeva vaikutustenarviointi. 
      • Selvitä, vaatiiko projektisi vaikutusten arviointia  Tarvitseeko tutkimukseni vaikutustenarvioinnin? lomakkeen avulla
      • Tarvittaessa tee Vaikutustenarviointi.
    • Arvioi miten voit toteuttaa rekisteröidyn oikeudet
    • Mikäli siirrät tai luovutat aineistoa käsiteltäväksi EU:n ulkopuolelle, kerro miten siirtojen lainmukaisuudesta huolehditaan. Tietoja voi siirtyä EU:n ulkopuolelle esimerkiksi jos luovutat tietoja kumppaneille jotka sijaitsevat EU:n ulkopuolella tai jos käytät tietojen käsittelyssä pilvipalvelua, jonka palvelimet sijaitsevat EU:n ulkopuolella. 

Lisäohjeita

Kuvaa, mitä aineiston käytöstä on sovittu sekä kohdistuuko aineistoon kolmansien osapuolten oikeuksia. Ennakoi, millä lisenssillä aineistoa aiotaan julkaista.

Ohjeita datan omistusoikeuksista ja lisensseistä

  • Huolehdi että kaikki tarvittavat sopimukset on tehty jo heti projektin alussa (aineiston omistajuus, kirjoittajuus ja tulokset). 
    • Muista, että useimmat rahoittajat (Suomen Akatemia, EU) edellyttävät aineiston oikeuksien siirtämistä yliopistolle.
    • Ohjeita sopimusten tekemiseen (Flamma)
  • Kun avaat aineistoa, käytä lisenssiä.

Lisäohjeita

Helsingin yliopiston tutkimusdatapolitiikka 

Hyvä tieteellinen käytäntö (HTK)

Do­ku­men­toin­ti ja me­ta­tie­dot

Metadata on dokumentaatiota, jolla kuvataan tutkimusdataa tai -aineistoa.

Metadatastandardilla tarkoitetaan yhtenäistä mallia tutkimusaineiston kuvailuun.

Dokumentoinnissa kuvataan, kuka datan tai aineiston on kerännyt, miten ja missä, milloin se on kerätty ja miten käsitelty. Nämä metatiedot voivat sisältää tietoa myös koeasetelmasta, analyysimenetelmästä ja tutkimusympäristöstä. 

"Tutkimusaineistojen metadata tulee julkaista aina kun se on mahdollista, joko kansallisissa tai kansainvälisissä metadatapalveluissa. Tutkimusaineistojen dokumentoinnin ja metatietojen tulee noudattaa tieteenalan standardeja, jotta aineistoa voidaan hyödyntää ja rikastaa myöhemmissä tutkimushankkeissa." (Tutkimusdatapolitiikka)

Projektin aikana dokumentointia ovat mm. muuttujien ja koodien selitteet (tietohakemistot, koodikirjat) ja readme-tiedostot. Lisäksi dokumentaatioon liittyvät tiedostojen nimeämiskäytännöt, versionhallinta ja kansiorakenne. 

Projektin jälkeen tutkimusaineistot kuvataan kokonaisuutena tai esim. datatyypeittäin data-arkistoihin tai metadataluetteloihin datan julkaisemisen tai säilytyksen yhteydessä.

Hyviä käytäntöjä

  • Muista aineiston kuvailun yhteydessä, että myös tiedostonimet, tiedostokansioiden nimet sekä muuttujat ja metadata saattavat sisältää henkilötietoja tai arkaluonteista tietoa.
  • Tutustu Helsingin yliopiston dokumentointioppaaseen
  • Suunnittele datan dokumentointi ennen datan keräämistä. Aloita dokumentointi ja metadatan luominen heti projektin alussa ja jatka tutkimuksen loppuun asti. 
  • Data-arkistot edellyttävät usein tietyn metatietostandardin käyttämistä. Tarkista myös, onko tieteenala- tai yhteisökohtaista metatietomallia tai -standardia saatavilla.
  • Jos sopivaa metatietostandardia ei ole olemassa, voit laatia "readme"-tyylisen metatietodokumentin.
  • Käytä yleisesti hyväksyttyjä sanastoja aineiston kuvailuun. Sopivia sanastoja löydät Fintosta tai EMBL-EBI Ontology -hakupalvelusta.
  • Koodien ja algoritmien dokumentointiin hyödynnä yliopiston GitLab-versionhallintapalvelua.
  • Avaa metadata muiden tutkijoiden löydettäväksi esim. Etsin-palveluun. Vaatimukset metadatalle voi tarkistaa Qvain-työkalun ohjeista.

Lisäohjeita:

Tal­len­ta­mi­nen ja pää­syn­hal­lin­ta

Vastaa seuraaviin kysymyksiin:

  • Minne aineisto tallennetaan ja varmuuskopioidaan tutkimushankkeen aikana?
  • Kuka on vastuussa varmuuskopioinnista?
  • Tee suunnitelma yhteistyökumppaniesi kanssa ja varmista tietojen turvallinen siirto ja jakaminen osallisten välillä.

Aineiston avaaminen, julkaiseminen ja arkistointi tutkimushankkeen päätyttyä kuvataan kohdassa aineiston avaaminen ja pitkäaikaissäilytys.

Hyviä käytäntöjä

  • Käytä Helsingin yliopiston tietotekniikkakeskuksen tallennus- ja jakamispalveluita: tallennuspalvelutaulukko.
  • Office 365 -pilvipalvelut ovat käteviä jakamiseen ja yhteistyöhön, jos aineisto ei ole arkaluontoista tai luottamuksellista.
  • Älä käytä koneen sisäistä kovalevyä tai USB-levyjä pääasiallisena tallennusvälineenä.

Varmista että projektillasi on riittävästi tallennuskapasiteettia. Lisää levytilaa saat ottamalla yhteyttä Helpdeskiin puh. 02 941 55555 tai helpdesk@helsinki.fi

  • Jos työskentelet arkaluontoisen tai luottamuksellisen aineiston kanssa:
    • Varmista, että tallennusratkaisusi on tarpeeksi turvallinen aineistollesi, esim. erillinen HY:n tai CSC:n turvatallennuspalvelu (Umpio, tallennuspalvelin, ePouta...).
    • Salaus tarpeen mukaan. Erityisesti mobiililaitteet, kannettavat ja ulkoiset tallennuslaitteet on pyrittävä salaamaan. Esim. Cryptomator.
    • Ota yhteyttä datasupport@helsinki.fi, jos olet epävarma aineiston suojaamisesta.

 

Lisäohjeita
Using & Storing (HY:n aineistonhallinnan opas)
Tutkimusdatapalvelut Helsingin yliopistolla

Vastaa seuraaviin kysymyksiin:

  • Kuka (nimeä henkilö) valvoo pääsynhallintaa aineistoihin?
  • Miten valvonta toteutuu käytännössä? Onko käytössä IT-ratkaisu (esim. salasanan takana oleva käyttöoikeus, muutosloki) tai fyysinen ratkaisu (esim. arkistokaappi/ kassakaappi)?
  • Kenellä tutkimusryhmässä on oikeus mihinkin aineistoon?
  • Miksi kukin käyttöoikeus (muokkaus, katselu, poisto) on myönnetty?
  • Kerro, kuinka arkaluontoisen aineiston tietoturva ja riskit on otettu huomioon. Säilytetäänkö aineisto esimerkiksi kryptattuna? Lisävinkkejä alla.

Hyviä käytäntöjä

  • Kun käytät henkilökohtaista tai jaettua verkkolevytilaa, pystyt helposti hallitsemaan käyttöoikeuksia.
  • Arkaluontoisen aineiston pääsynhallintaan pitää kiinnittää erityistä huomiota. Aineiston käytön ja siirron pitää olla suostumuksen ehtojen mukaista, mikäli aineisto on saatu käyttöön suostumuksen perusteella.
  • Pääsynhallinta: Käytössä pitää olla lista myönnetyistä oikeuksista ja käyttäjistä sekä tapa, jolla käyttöoikeuksia aineistoon voi myös perua ja poistaa.
  • Valvonta: Miten aineiston käyttöä seurataan tutkimuksen aikana? Pystyvätkö käytetyt tekniset välineet pitämää kirjaa siitä kuka käytti, mitä aineistoa ja milloin? Kysy organisaatiosi IT-tuesta, onko tarjolla käyttö- ja muutoslokitusta.
  • Tilaturvallisuus: Tarkista työtilojen lukitukset, turvalliset säilytyskalusteet, kameravalvonta ja kulkuoikeuksien valvonta.

Lisäohjeita
Kyberturvallisuuskeskus: Ohje lokitietojen tallentamiseen ja hyödyntämiseen
HY Helpdesk puh. 02 941 55555 tai helpdesk@helsinki.fi

Ai­neis­ton avaa­mi­nen ja pit­kä­ai­kais­säi­ly­tys

Mikä osa aineistosta avataan / julkaistaan? Missä data-arkistossa aineiston osat julkaistaan? Milloin aineisto on saatavilla? Poistetaanko / tuhotaanko jokin aineiston osa?

Jos aineistoasi ei voida avata kokonaan tai osittain, perustele miksi, ja kerro, missä aineiston metatiedot julkaistaan.

Vinkkejä henkilötietoja sisältävän aineiston avaamiseksi

  • Henkilötietoja sisältävän aineiston avaamisen ja jakamisen mahdollisuuksiin vaikuttavat mm. se, mitä tutkittaville on informoitu tietoja kerättäessä, onko tutkittavalta saatu tähän nimenomainen suostumus, tai missä muodossa sekä mihin tarkoituksiin tiedot aiotaan avata tai jakaa.
    • Avaamisessa tulee huolehtia edelleen tietojen asianmukaisesta suojaamisesta ja mahdollisuuksien mukaan pseudonymisoida tai anonymisoida tiedot.
    • Aineiston avaamiseen, josta tutkittavat ovat suoraan tunnistettavissa, on lähtökohtaisesti pyydettävää tutkittavalta suostumus.  
    • Aineisto voidaan jakaa joissain tapauksissa alkuperäisen käsittelytarkoituksen mukaiseen tarkoitukseen. Jos suunnittelet henkilötietoja sisältävän aineiston jakamista, ota yhteyttä yliopiston tutkimuspalvelujen juristeihin (tutkimuksenjuristit@helsinki.fi)
  • Vaikka henkilötietoja sisältävää aineistoa ei voisi avata, sen keskeiset (ei arkaluonteisia yksityiskohtia sisältävät) kuvailutiedot pitää avata.

Hy­viä käy­tän­tö­jä

  • Valitse sopivat palvelut aineistojesi jakamista ja säilytystä varten jo tutkimuksen alkuvaiheessa. Huolehdi myös siitä, että aineistosi täyttää valitsemasi palvelun asettamat vaatimukset. 
  • ”Helsingin yliopiston piirissä tuotettu, julkaistuihin tutkimustuloksiin liitetty tutkimusaineisto on lähtökohtaisesti yhteiskäyttöistä ja avointa. Aineiston löydettävyydestä ja viitattavuudesta on huolehdittava.” (Helsingin yliopiston tutkimusdatapolitiikka)
  • Missä aineisto kannattaa julkaista: 
    • Tarkista oman alasi kustantajien, tieteellisten seurojen ja rahoittajien suositukset. 
    • Missä sinä tai alasi kollegat ovat julkaisseet aineistoja?
    • Hae tietylle aineistotyypille sopiva julkaisupaikka re3data.org palvelusta
    • Yleisiä julkaisupaikkoja: IDA, Zenodo, DryadFigshare 
  • Jos et voi avata aineistoa, julkaise kuitenkin tutkimusaineiston metatiedot, esim. Zenodossa tai kansallisessa Etsimessä.
  • Valitse pysyviä tunnisteita (DOI, URN) käyttävä palvelu
  • Muista antaa aineistollesi käyttölisenssi (kts. 2)

Aineiston pitkäaikaissäilytyksellä tarkoitetaan vähintään 25 vuoden säilytysaikaa, mutta jopa satoja vuosia. Jos aineistollasi on pitkäaikaista arvoa:

  1. Mikä osa aineistosta arkistoidaan?
  2. Missä arkistossa aineistoa säilytetään?
  3. Kuinka pitkään aineisto säilyy ko. arkistossa?
  4. Onko arkistoinnissa kuluja ja kuka niistä vastaa?
  5. Tuhotaanko joku osa aineistosta?

Arkistointisuunnitelma on osa tutkimuksen laadun ja läpinäkyvyyden varmistusta.

Hy­viä käy­tän­tö­jä

  • Tutkimuksessa syntyvän aineistolle säilytysaika on tärkeä miettiä ja sopia sitä mukaan kuin aineistoa syntyy. 
  • Tarkistaa kustantajan vaatimukset julkaisuun liittyvän aineiston säilyttämisajasta.
  • Muista tarkistaa rahoittaja- ja alakohtaiset suositukset.
  • Myös henkilötietoja sisältävä aineisto voidaan arkistoida. Siirrettäessä henkilötietoja sisältävää tutkimusaineistoa arkistoon, tulisi henkilöiden tunnistetiedot mahdollisuuksien mukaan poistaa, ellei niiden arkistoinnille ole asianmukaista perustetta, johtuen aineiston luonteesta. Arkistoinnista on myös informoitava tutkittavia, sekä siitä mihin aineiston arkistointi perustuu. Aineiston arkistoinnissa on edelleen huomioitava henkilötietojen asianmukainen suojaaminen eli kenellä aineistoon on pääsy ja miksi. 
    • Helsingin yliopistolla on tarjolla neuvontaa turvallisten tallennusratkaisujen valintaan. Jos olet säilyttämässä pitkään arkaluonteista henkilötietoa, ota yhteyttä: datasupport@helsinki.fi
  • Näytteisiin liittyvä aineisto voidaan arkistoida biopankkiin.
  • Kansallisesti arvokkaille aineistoille on tarjolla Fairdata-PAS -palvelu aineistojen säilyttämiseksi kymmenistä satoihin vuosiin. Lisätietoja HY:n PAS palvelusta.
Ai­neis­ton­hal­lin­nan vas­tuut ja re­surs­sit

Kerro, kuka on vastuussa aiemmissa kohdissa kerrotuista suunnitelmaan liittyvistä tehtävistä ja mitä rooleja siihen liittyy?

  • Onko aineistonhallinta tietyn henkilön vai koko tutkimusryhmän vastuulla?
  • Miten tehtävät jakautuvat konsortion tai yhteistyöhankkeen osallistujien kesken?
  • Kuka vastaa aineiston tietosuojaan liittyvistä asioista?
  • Jos aineisto sisältää henkilötietoja, kerro mitkä tahot käsittelevät henkilötietoja ja missä roolissa (rekisterinpitäjä, yhteisrekisterinpitäjä, käsittelijä)?
  • Kuka vastaa aineiston tietoturvasta ja käyttöoikeuksien jakamisesta?

Hyviä käytäntöjä

  • Noudattakaa yhteisiä käytäntöjä aineiston käsittelyssä (esim. datan dokumentointi, metadata, tallennus ja jakaminen).
  • Huolehtikaa siitä, että kaikki projektiin osallistuvat henkilöt ovat saaneet riittävän perehdytyksen tai koulutuksen datanhallintaan liittyviin tehtäviin. 
  • Sopikaa, kuka on vastuussa suunnitelman täytäntöönpanosta ja päivittämisestä.
  • Nimetkää henkilöt tai organisaatiot eri tehtäviin, jos mahdollista.
  • Henkilötietojen käsittelyyn liittyvät roolit ja vastuut on määriteltävä tutkimusprojektiin osallistuvien yhteistyökumppanien kesken.
  • Sopikaa myös, kuka vastaa aineistosta projektin päätyttyä.

Mitä resursseja (aika ja kustannukset) aineistonhallintaan tarvitaan? Mitä paremmin tutkimusaineiston hallinta on suunniteltu ja toteutettu jo tutkimushankkeen alussa ja sen aikana, sitä vähemmän työtä tarvitaan aineiston avaamisessa ja arkistoinnissa.

Huolellinen aineistonhallinan suunnittelu projektin alussa ja sen aikana vähentää työtä projektin lopussa, kun aineistoa valmistellaan avaamista ja arkistointia varten.

Hyviä käytäntöjä

  • Arvioi, edellyttääkö aineiston hallinnointi, säilyttäminen ja jakaminen asiantuntija-apua tai palkattua työntekijää.
  • Anna arvio ajasta, joka menee data-aineiston (ei tulosten) siistimiseen ja dokumentointiin julkaisukuntoon. Esimerkiksi: siihen käytetään viikoittain aikaa 1-2 h, kuukaudessa päivä, 1-2 viikkoa ennen arkistointia tms.
    • Aineiston siistiminen ja dokumentointi tarkoittaa muun muassa metatiedon tuottamista (kohta 3.1), henkilötietoa sisältävän aineiston anonymisointia, aineiston valintaa, järjestelyä ja siirtämistä.
    • On suositeltavaa pitää dokumentointi ajan tasalla koko tutkimuksen elinkaaren ajan.
  • Ota huomioon arkaluonteisen aineiston suojaamiseen, anonymisointiin ja poistamiseen tarvittava aika ja sen aiheuttamat kustannukset.
  • Erittele aineistonhallinnan kustannukset budjetissa rahoittajan ohjeiden mukaisesti.