Planering av datahantering

Hantering och planering av forskningsdata är en väsentlig del av god forskningspraxis. Läs också Helsingfors universitets anvisningar och rekommendationer för datahanteringsplanen nedan.
Minimera risker genom god planering av datahantering

Datahanteringsplanen (Data Management Plan, DMP) beskriver hur forskningsmaterial hanteras under hela livscykeln för forskningsprojekt. Datahanteringsplanen hjälper dig att identifiera och förutse riskerna som är förknippade med datahanteringen och att beakta lagstiftning, tillräckligt dataskydd och datasäkerhet. I samband med att planen utarbetas görs en genomgång av hur materialet lagras, av upphovsmannaskap och av materialets användning.

 

Datahanteringsplanen är en del av forskningsplanen

I forskningsplanen beskrivs till exempel vilka metoder som använts för att analysera materialet, medan datahanteringsplanen beskriver hur materialet hanteras och hur en fortsatt användning av materialet säkerställs. Datahanteringsplanen är inte ett statiskt dokument, utan planen uppdateras kontinuerligt under projektets gång. I bästa fall är datahanteringsplanen en praktisk och lättförståelig anvisning som garanterar materialets kvalitet och integritet.

Helsingfors universitets anvisningar för planering av datahantering

Använd verktyget DMPTuuli för att skapa en datahanteringsplan. DMPTuuli är ett verktyg för hantering av material och är öppet för alla. Vi rekommenderar att skapa datahanteringsplanen enligt anvisningen nedan, eftersom de ger mer detaljerade råd om praxisen vid Helsingfors universitet än de nationella anvisningarna. För att undvika upprepningar kan du i din datahanteringsplan hänvisa till forskningsplanen och vice versa. Beakta följande faktorer vid sammanställning av planen:

  • Följ de krav som organisationen eller finansiären ställer.
  • Besvara åtminstone huvudfrågorna. Om någon av frågorna inte är relevanta för din forskning ska du motivera varför.
  • Bifoga all relevant bakgrundsinformation till planen, såsom namnen på de sökande och projektet, projektets nummer och versionsinformation.
1. Forsk­nings­da­ta (forsknings­material)

Besvara följande frågor:

  • Vilka data används och produceras? Om du använder känsliga uppgifter ska du se exempel i anvisningarna nedan.
  • Vilket filformat har materialet?
  • Uppskatta den sammanlagda storleken och sampelstorleken på materialet, till exempel i antal gigabyte.
  • Använder ni några särskilda program eller utvecklar ni egna?

God praxis

Räkna upp datatyperna som en lista eller tabell enligt klassificeringen nedan. Planen bygger på de typer av data som beskrivs och om du använder kategorisering eller förkortningar för att beskriva datatyperna har du lättare att hänvisa till dessa data i den senare delen av planen. 

Exempel 1, typer av data i listformat:

1. Material som samlas in för undersökningen

  • Enkät om ämnet x, filformat .pdf, storlek 5 GB
  • DNA-prov (precisera provets ursprung – människa eller annan organism), fysiskt prov, storlek n=500
  • bilder/videor om ämnet x, filformat .jpg, .avi, storlek 1 TB

2. Material som produceras till följd av forskningsprocessen

  • Analyser av enkätmaterial, .pdf, .xlsx, 2 GB
  • DNA sekvens/analys, FASTA, .txt, .xlsx, 2 TB
  • Dokumentationsmaterial (enkät, kodbok, laboratoriedagbok, readme-filer)

3. Material som samlats in tidigare 

  • Vävnadsprover från en biobank
  • Material x från Statistikcentralen, databas, 10 GB
  • Enkätmaterial från Finlands samhällsvetenskapliga dataarkiv databas Aila
  • Intervjumaterial eller språkkorpus från Språkbanken

 

Eftersom särskilt stora risker är förknippade med känsliga uppgifter i forskningsmaterialet kräver identifiering och hantering av sådant material särskild noggrannhet. När det gäller personuppgifter ska du ange vem som är personuppgiftsansvarig. Mer information: Dataskyddanvisning för forskare (Flamma) och Kompletterande anvisning för planering av hantering av data som innehåller känsliga och konfidentiella uppgifter.

Känslig och konfidentiell information är sådan som kan orsaka skada om den avslöjas. Här följer exempel på sådant material.

  • Uppgifter om personer:
    • Alla uppgifter på basis av vilka en person kan identifieras antingen direkt eller indirekt är personuppgifter:
    • direkta identifierare: namn, telefonnummer, personbeteckning, foto, röstprov, fingeravtryck, tandkarta
    • indirekta identifierare: kön, ålder, utbildning, yrkesställning, nationalitet, positionsuppgifter, arbetshistoria, logguppgifter, civilstånd, bostadsort, en bils registernummer, åsikt, psykisk eller fysisk egenskap
  • Känsliga uppgifter om personer:
    • Särskilda kategorier av personuppgifter:
      • uppgifter som avslöjar ras eller etniskt ursprung, politiska åsikter, religiös eller filosofisk övertygelse eller medlemskap i fackförening 
      • genetiska uppgifter 
      • biometriska uppgifter, om de behandlas med tekniska metoder för att entydigt identifiera en person 
      • uppgifter om hälsa
      • uppgifter om en fysisk persons sexualliv eller sexuella läggning.
    • Andra uppgifter om personer som anses känsliga:
      • ekonomisk eller social ställning
      • positionsuppgifter
      • kommunikation
      • beteende
      • andra uppgifter som upplevs som särskilt privata till exempel anteckningar och dagböcker
  • Sensitiva artdata, t.ex. uppgifter om utrotningshotade djur och växter, naturskydd eller biosäkerhet.

Annan konfidentiell information, t.ex. patent, landets försvar, organisatorisk information eller affärshemligheter.

Lyft fram dolda risker när det gäller att säkerställa materialets enhetlighet och kvalitet och beskriv hur riskerna hanteras. Observera att materialets kvalitet och forskningsmetodens kvalitet innebär olika saker.

God praxis

Beskriv till exempel följande praxis i dina svar:

  • Vilka verktyg för datahantering står till ditt förfogande, såsom databassystem, elektronisk laboratoriedagbok eller elektronisk enkät?
  • Hur utbildas personer som hanterar materialet?
  • Har metoderna som använts validerats, används en kvalitetshandbok?
  • Kontrollerar någon transkriberingen av inspelningar eller intervjuer?
  • Används kontrollsummor?
  • Motsvarar det digitaliserade materialet med tillräcklig noggrannhet det fysiska eller analoga originalmaterialet?
  • Säkerställs det att originalinnehållet bevaras om filerna flyttas, ändras eller konverteras från ett system till ett annat?

Fundera över hur eventuell minimering, pseudonymisering eller anonymisering (på finska/engelska) påverkar datamaterialets kvalitet.

2. Lakt­ta­gan­de av etis­ka prin­ci­per och lag­stift­ning

Besvara följande frågor:

  • Innehåller ditt material uppgifter om personer?
  • Innehåller materialet aspekter som det anges riktlinjer för i de allmänna eller ämnesspecifika anvisningarna?
  • Behöver din forskning en etisk förhandsprövning som vid behov görs innan insamlingen av material inleds?
  • Vilka forsknings- eller myndighetstillstånd krävs? T.ex. Findatas datatillstånd, målorganisationens forskningstillstånd?
  • Hanterar du annat sekretessbelagt eller konfidentiellt material än det som nämns ovan (t.ex.sensitiva artdata, uppgifter om skyddsområden eller försvarsmakten)?
  • Finns det upphovsrätts- eller patentfrågor i anslutning till materialet?
  • (Kan din forskning beröras av internationella sanktioner eller exportkontroller?)

Beskriv hur du uppfyller de etiska kraven och följer relevant lagstiftning vid hanteringen av materialet. Beskriv även de största riskerna och hur du hanterar dem.

  • Underbygg din rätt att samla in, hantera och lagra material som berörs av etiska frågor. Har till exempel en eventuell etisk förhandsprövning gjorts? Beskriv även hur du ber om informerat samtycke av dem som deltar i undersökningen.
  • Om du behandlar personuppgifter:
    • Beskriv hur du samlar in materialet och hur du beaktar de allmänna principerna för dataskydd.
      • Vilken är behandlingsgrunden? (vanligen vetenskaplig forskning av allmänt intresse)
      • Hur informerar du forskningspersonerna? (Öppenhet gentemot forskningspersonerna/dem som deltar i forskningsprojektet.)
      • Vilka uppgifter om personerna är nödvändiga och varför (minimeringsprincipen), berätta hur du vid behov anonymiserar eller pseudonymiserar (anvisningarna tillgängliga på finska och engelska) materialet.
      • Beakta att materialet endast ska användas för de ändamål för vilka det samlats in och som forskningspersonerna informerats om.
      • Se till att materialet inte lagras längre än nödvändigt (pseudonymisering, anonymisering, radering av materialet) och vad som sker med materialet efter att forskningen avslutats.
    • Bedöm vilka risker behandlingen av personuppgifter kan medföra för forskningspersonerna, och beskriv hur du undviker dem. Om behandlingen sannolikt medför en hög risk för forskningspersonerna, ska du även genomföra en konsekvensbedömning avseende dataskydd.
    • Bedöm hur du kan säkerställa forskningsdeltagarnas rättigheter.
    • Om du överför eller utlämnar material för behandling utanför EU ska du beskriva vilka åtgärder som vidtas för att säkerställa lagenligheten i överföringarna. Material kan komma att överföras till länder utanför EU om du utlämnar det till samarbetspartner utanför EU eller använder molntjänster utanför EU för att behandla materialet. 

Närmare anvisningar

Närmare anvisningar om ytterligare krav som till exempel berör hur forskningspersonerna informeras och behandlingen av personuppgifter dokumenteras hittar du med hjälp av länkarna nedan.

Dataskyddanvisning för forskare på Flamma,
informering av forskningspersonerna (användarhandboken för datahantering på finska och engelska, Dataarkivet) och
anvisningar som gäller forskningsetik på Flamma och universitetets externa webbplats.

Beskriv vad som har avtalats om användningen av materialet och som berör en tredje parts rättigheter. Förutse med vilka licenser materialet ska publiceras.

Anvisningar för äganderätt och licensering av data

  • Se till att alla avtal har ingåtts redan i början av forskningsprocessen (om äganderätt till materialet, upphovsmannaskapet och resultat).
    • Kom ihåg att de flesta finansiärer (Finlands Akademi, EU) förutsätter att rättigheterna till materialet överförs till universitetet.
    • Anvisningar för ingående av avtal (Flamma)
  • När du tillgängliggör materialet använder du en licens.

Närmare anvisningar

Helsingfors universitets forskningsdatapolicy 

God vetenskaplig praxis (GVP)

3. Do­ku­men­tation och metadata

Metadata är dokumentation som beskriver forskningsdata eller forskningsmaterialet.

Med metadatastandard avses en enhetlig modell för beskrivning av forskningsmaterialet.

Dokumentationen innehåller information om vem som har samlat in materialet, hur och var det samlats in och hur det har hanterats. Metadata kan också innehålla information om försöksupplägget, analysmetoden och forskningsmiljön. 

”Metadata om forskningsdata ska publiceras i antingen nationella eller internationella metadatatjänster när det bara är möjligt. Dokumentationen av forskningsdata, liksom metadata om dem, ska följa standarderna inom vetenskapsområdet för att forskningsmaterialet ska kunna utnyttjas och utökas i senare forskningsprojekt.” (Forskningsdatapolicy)

Under projektets gång dokumenteras bland annat förklaringar till variabler och koder (datakataloger, kodböcker) och readme-filer. Dessutom dokumenteras filernas benämningspraxis, versionshantering och katalogstruktur. 

Efter projektet beskrivs forskningsmaterialet som en helhet eller till exempel indelat enligt vilken typ av data de består av för dataarkiv eller metadatakataloger i samband med att data publiceras eller lagras.

God praxis

  • När du beskriver datamaterialet ska du komma ihåg att även filnamn, filkatalognamn samt variabler och metadata kan innehålla personuppgifter eller känslig information.
  • Bekanta dig med Helsingfors universitets dokumentationsguide
  • Planera dokumentationen av data innan du samlar in dem. Börja dokumentera och skapa metadata genast i början av projektet och fortsätt ända till projektets slut. 
  • Dataarkiv förutsätter ofta att en viss standard för metadata används. Kontrollera också om det finns mallar eller standarder för metadata som är specifika för vetenskapsområdet eller vetenskapssamhället.
  • Om det inte finns någon lämplig standard för metadata kan du skapa ett metadatadokument i ”readme-format”.
  • Använd allmänt accepterade vokabulärer för att beskriva materialet. Lämpliga vokabulärer hittar du i söktjänsten Finto eller EMBL-EBI Ontology.
  • För att dokumentera koder och algoritmer kan du använda universitetets versionshanteringstjänst GitLab.
  • Gör metadata tillgänglig för att andra forskare ska hitta dem till exempel via tjänsten Etsin. Kraven på metadata kan kontrolleras i anvisningarna för Qvain-verktyget.

Närmare anvisningar:

Finlands samhällsvetenskapliga dataarkivs guide till beskrivning inom datahantering (på finska).

4. Lag­ring och åt­komst­kon­troll

Besvara följande frågor:

  • Var lagras och sparas säkerhetskopior under forskningsprojektet?
  • Vem ansvarar för säkerhetskopiering?
  • Gör upp en plan tillsammans med dina partner och säkerställ att informationen överförs säkert och delas mellan deltagarna.

Hur du gör för att tillgängliggöra, publicera och arkivera data efter avslutat forskningsprojekt beskrivs i punkt 5.

God praxis

Försäkra dig om att projektets lagringskapacitet räcker till. Mer lagringsutymme får du genom att kontakta Helpdesk tfn 02 941 55555 eller helpdesk@helsinki.fi.

  • Om du arbetar med känsligt eller konfidentiellt material:
    • Se till att din lagringslösning är tillräckligt säker för ditt material, till exempel en separat säker lagringstjänst som tillhandahålls av Helsingfors universitet eller CSC (Umpio, lagringsserver, ePouta...).
    • Vid behov används kryptering. I synnerhet mobila enheter, bärbara datorer och externa lagringsenheter krypteras. Till exempel genom att använda Cryptomator.
    • Kontakta datasupport@helsinki.fi om du är osäker på hur du ska skydda materialet.

Närmare anvisningar
Using & Storing (Helsingfors universitets guide för datahantering)
Forskningsdatatjänster vid Helsingfors universitet

Besvara följande frågor:

  • Vem (ange person) reglerar åtkomsten till materialet?
  • Hur sker övervakningen i praktiken? Används en IT-lösning (t.ex. åtkomsträttigheter som skyddas av lösenord, ändringslogg) eller en fysisk lösning (t.ex. arkivskåp/kassaskåp)?
  • Vem i forskningsgruppen har åtkomsträttigheter till vilket material?
  • Varför har rättigheterna beviljats (redigera, läsa, radera)?
  • Beskriv hur dataskydd och risker beaktats för känsligt material. Lagras materialet till exempel krypterat? Fler tips nedan.

God praxis

  • Genom att använda din personliga eller en delad nätverksdisk kan du enkelt hantera åtkomsträttigheterna.
  • Särskild uppmärksamhet ska ägnas åt hantering av åtkomst till känsligt material. Användning och överföring av materialet ska ske i enligt med samtycket om materialet har samlats in på basis av samtycke.
  • Administration av åtkomst till data: Det måste finnas en lista över beviljade rättigheter och användare samt ett sätt på vilket åtkomsträttigheter till materialet också kan återkallas och avlägsnas.
  • Övervakning: Hur kommer användningen av materialet att övervakas under projektets gång? Kan de tekniska verktyg som används föra en logg över vem som använt material, vilket material som använts och när materialet användes? Fråga IT-stödet vid din organisation om det finns loggar för användning och ändring av data.
  • Lokalsäkerhet: Kontrollera att arbetslokaler är låsta, att förvaringsmöbler är säkra, att det finns kameraövervakning och övervakning av tillträde.

Närmare anvisningar
Cybersäkerhetsscentret: Så här samlar du in och använder loggdata
HU:s Helpdesk tfn 02 941 55555 eller helpdesk@helsinki.fi

5. Till­gäng­lig­gö­ran­de och lång­tids­be­va­ring ef­ter av­slu­tat forsk­nings­pro­jekt

Besvara följande frågor, du kan till exempel hänvisa till tabellen i punkt 1 (om du gjorde en sådan):

  • Vilken del av materialet görs öppet tillgängligt/publiceras?
  • Var publiceras materialet? Ange eventuella dataarkiv.
  • När kan materialet göras öppet tillgängligt/publiceras?
  • Förstörs någon del av materialet?
  • Behöver materialet bearbetas eller behandlas innan det görs tillgängligt/publiceras (anonymisering, pseudonymisering)? 

Om ditt material inte kan göras helt eller delvis tillgängligt:

  • Varför kan materialet inte göras tillgängligt?
  • Var publiceras metadata om materialet?
  • Även om material som innehåller personuppgifter inte kan göras tillgängligt rekommenderas att de centrala beskrivningarna (som inte innehåller känsliga uppgifter) görs tillgängliga.

Tips om hur material som innehåller personuppgifter görs tillgängligt

  • Möjligheten att göra material som innehåller personuppgifter tillgängligt beror bland annat på följande:
    • Den information som forskningspersonerna getts när materialet samlades in (om materialet samlats in direkt från forskningspersoner).
    • För att göra sådant material tillgängligt där forskningspersonerna kan identifieras krävs forskningspersonernas samtycke.
    • Begränsas en fortsatt användning av materialet av myndighetstillstånd? 
    • När material görs öppet tillgängligt ska uppgifterna skyddas på ett adekvat sätt och uppgifterna ska i den mån det är möjligt minimeras samt pseudonymiseras eller anonymiseras. 
    • Om du planerar att dela material som innehåller personuppgifter ska du kontakta juristerna vid universitetets juridiska service (tutkimuksenjuristit@helsinki.fi).

God praxis

  • Planera hur materialet görs tillgängligt redan i början av forskningsprojektet. Se till att ditt material uppfyller kraven för det valda dataarkivet.
    • Du kan söka efter datarepositorier som är lämpliga för din typ av material i tjänsterna re3data.org och fairsharing.org
    • Välj datarepositorier som är specifika för ditt vetenskapsområde. Om det inte finns någon sådan kan du använda publiceringsplattformar som lämpar sig för alla vetenskapsområden, såsom IDA, Zenodo, Dryad eller Figshare.
    • Beakta även vilken nivå på datasäkerhet tjänsten erbjuder om ditt material behöver skyddas. 
  • Om du inte kan göra materialet öppet tillgängligt ska du ändå publicera materialets metadata, till exempel i Zenodo eller i den nationella Etsin.

Närmare anvisningar

Helsingfors universitets forskningsdatapolicy
Helsingfors universitets principer för öppen vetenskap
Forskarens minneslista vid publicering av forskningsdata (Ansvarsfull forskning)

Var arkiveras material som är av långsiktigt värde, och för hur lång tid kan det lagras?

  • Vilken del av materialet arkiveras?
  • I vilket arkiv lagras forskningsmaterialet?
  • Hur länge lagras materialet i arkivet?
  • Kostar arkivering, och vem står för kostnaderna?

Arkiveringsplanen är en del av att säkerställa forskningens kvalitet och transparens.

God praxis

  • Det är viktigt att tänka på lagringstiden för material som produceras under forskningsprojektet och komma överens om det allteftersom materialet produceras.
  • Kontrollera förläggarens krav på lagringstiden för materialet som publiceras.
  • Kom ihåg att kontrollera rekommendationer som är specifika för finansiären och vetenskapsområdet.
  • Också material som innehåller personuppgifter kan arkiveras.
    • Forskningspersonerna måste informeras om materialets planerade livscykel och eventuell fortsatt användning av forskningsmaterialet efter att forskningsprojektet har avslutats. Det här gäller även forskningsmaterial som pseudonymiserats och anonymiserats.
    • När forskningsmaterial arkiveras ska identifieringsuppgifterna om personer om möjligt avlägsnas, om det inte finns en motiverad grund att arkivera dem.
    • Vid arkiveringen ska personuppgifterna fortfarande skyddas på adekvat sätt: det vill säga vem som har åtkomst till materialet och varför samt nivån på datasäkerhet. 
    • Helsingfors universitet erbjuder rådgivning när det gäller valet av säkra lösningar för lagring av data. Kontakta oss: datasupport@helsinki.fi
  • Material som innehåller mänskliga prover kan arkiveras i biobanker (om du har samtycke från forskningspersonerna, bekanta dig med anvisningarna för biobanken).
  • För material som är nationellt värdefullt erbjuds tjänsten Fairdata-PAS för att lagra materialet från ett tiotal till hundratals år. Mer information om tjänsten för långtidsförvaring här.
  • Även om projektet inte producerar material som kräver långtidsförvaring ska data lagras under tiden som resultaten verifieras. Den här tiden varierar beroende på vetenskapsområde (i allmänhet minst 5 år).

 

Närmare anvisningar

Five steps to decide what data to keep (DCC, UK)
Helsingfors universitets anvisningar för förvaring av dokument (Flamma)
Förstöring av data (handbok för datahantering (på finska/engelska), Finlands samhällsvetenskapliga dataarkiv)

6. An­svar och re­sur­ser vid han­te­ring av forsk­nings­da­ta

Berätta vem som ansvarar för de uppgifter som nämndes i föregående punkter och på vilka roller ansvaret fördelats.

    • Är datahanteringen på en enskild persons eller hela forskningsgruppens ansvar?
    • Hur har uppgifterna fördelats bland konsortiet eller deltagarna i samarbetsprojektet?
    • Vem ansvarar för frågor som berör materialets dataskydd?
    • Om materialet innehåller personuppgifter, berätta vem som hanterar personuppgifterna och vilka roller de har (personuppgiftsansvarig, gemensam personuppgiftsansvarig, handläggare).
    • Vem ansvarar för dataskyddet och administration av åtkomsträttigheter?

God praxis

  • Följ gemensam praxis vid hantering av materialet (t.ex. dokumentation av data, metadata, lagring och delning).
    • Se till att alla som deltar i projektet har tillräcklig introduktion och utbildning i uppgifter som berör datahantering. 
    • Kom överens om vem som ansvarar för att verkställa och uppdatera planen.
    • Utse personer eller organisationer för uppgifter, om det är möjligt.
    • Roller och ansvar för hanteringen av personuppgifter måste definieras bland de samarbetsparter som deltar i forskningsprojektet.

Kom även överens om vem som ansvarar för materialet efter att projektet avslutats.

Vilka resurser (tid och kostnader) krävs för datahanteringen? Ju bättre hanteringen av forskningsmaterialet planerats och genomförts redan i början och under projektet, desto mindre arbete krävs för att tillgängliggöra och lagra materialet.

Noggrann planering av datahanteringen i början av och under projektet minskar arbetet i projektets slutskede när materialet bereds för att göras tillgängligt och lagras.

God praxis

  • Bedöm huruvida det behövs experthjälp eller en anställd medarbetare för administration, lagring och delning av materialet.
  • Uppskatta hur mycket tid som går åt till att ordna upp, dokumentera och göra materialet (inte resultaten) publicerbart. Till exempel: varje vecka går det åt 1–2 timmar, en dag per månad, 1–2 veckor före arkivering.
    • Att ordna upp och dokumentera material innebär bland annat att producera metadata (punkt 3.1), anonymisera material som innehåller personuppgifter, välja samt arrangera och flytta materialet.
    • Det rekommenderas att hålla dokumentationen uppdaterad under forskningens hela livscykel.
  • Ge akt på den tid och kostnader som krävs för att skydda, anonymisera och avlägsna känsliga data.

Specificera kostnader för datahantering i budgeten enligt finansiärens anvisningar..