Han­te­ring av forsk­nings­da­ta
Datastödet vid Helsingfors universitet hjälper forskaren med planering av datahantering och erbjuder utbildning i hantering av forskningsdata. Datastödets specialister söker tillsammans med forskaren eller forskningsgruppen de bästa lösningarna för hanteringen av forskningsdatan under hela dess livscykel.
Da­ta­han­te­rings­plan

Din datahanteringsplan (data management plan, DMP) ska beskriva hur data kommer att hanteras såväl under som efter forskningsprojektets aktiva fas. Planen bör uppdateras i takt med att forskningsprojektet framskrider.

Datahanteringsplanen är ett komplement till din forskningsplan. För att undvika upprepningar kan du hänvisa till din forskningsplan i datahanteringsplanen och vice versa.

I datahanteringsplanen kan följande betraktas som forskningsdata (forskningsmaterial):

  • material som samlats in med olika metoder (prover, enkäter, intervjuer, mätningar, bedömningar, avbildningsmetoder osv.)
  • material som genererats under forskningsprocessen (t.ex. analyserat material)
  • annat källmaterial (t.ex. arkivmaterial)
  • anteckningar och fältanteckningar
  • källkoder och program.

Du kan använda det öppet tillgängliga programmet DMPTuuli för att skapa din datahanteringsplan. Listan nedan utgör Helsingfors universitets anvisning om datahanteringsplaner. Öppet tillgängliga datahanteringsplaner som skrivits av forskare vid Helsingfors universitet finns i Zenodo.

Orden forskningsmaterial och forskningsdata kan betyda olika saker beroende på kontext. Forskningsdata, forskningsmaterial och datamaterial används som synonymer (jfr. Helsingfors universitets forskningdatapolicy, 2021)

Forsk­nings­da­ta (forsknings­material)

Vilka slags data ska samlas in eller produceras? Vilka filformat används? Hur mycket diskutrymme/minne behövs för materialet?  Kommer du att utveckla eller använda särskild programvara?

Re­kom­men­da­tio­ner för bäs­ta prax­is

Se anvisningen under exemplen om du kommer att hantera känsliga data. Kategorisera ditt material i en punktlista eller tabell enligt följande mall, och använd samma indelning i alla stadier av din plan. Ditt svar på denna fråga utgör en övergripande struktur för resten av planen.

Exempel 1:

Data som samlas in för detta projekt

  • Frågeformulär x, filformat .pdf, storlek 5 GB
  • DNA-prover (n=500)
  • Bilder/videor om x, filformat .jpg, .avi, storlek 1 TB

Data som är ett resultat av processen

  • Analyser av frågeformulär x, .pdf, .xslx, 1 GB
  • DNA-sekvenser/-analyser, FASTA, .txt, .xslx, 2 TB
  • Dokumentation av data (README-filer, datakatalog, laboratoriedagböcker)

Befintliga data som insamlats tidigare och återanvänds i detta projekt

  • Biobanksprover
  • Statistikcentralens data, databas, 10 GB
  • Enkätdata ur Aila serviceportalen (Finlands samhällsvetenskapliga dataarkiv)
  • Intervjuer eller språkkorpusar ur Språkbanken i Finland

 

Det är särskilt viktigt att identifiera känsliga (sensitiva) data, eftersom man i datahanteringsplanen skall identifiera och hantera riskerna som är förknippade med sådan information. När det gäller personuppgifter: ange vilken person eller organisation som är personuppgiftsansvarig. Mer information: Dataskyddsanvisning för forskare (Flamma)

Känsliga data är information som kan orsaka skada om den avslöjas. Sådan information är till exempel:

  • Personuppgifter: 
    • Personuppgifter är alla de identifierare som gör en person direkt eller indirekt identifierbar.
    • Direkta identifierare: namn, telefonnummer, personbeteckning, fotografi, röst, fingeravtryck, tandkarta, osv.
    • Indirekta identifierare: kön, ålder, utbildning, yrke, nationalitet, arbetshistoria, logginformation från system, civilstånd, bostadsort, bilars registreringsnummer, osv.
  • Känsliga personuppgifter:
    • Särskilda kategorier av personuppgifter:
      • uppgifter om ras eller etniskt ursprung, politiska åsikter, religiös eller filosofisk övertygelse, medlemskap i en fackförening 
      • genetiska uppgifter 
      • biometriska uppgifter som entydigt identifierar en person 
      • uppgifter om hälsa
      • uppgifter om sexualliv eller sexuell läggning
    • Andra känsliga uppgifter: 
      • ekonomisk eller social ställning
      • platsinformation
      • kommunikation
      • beteende
      • andra uppgifter som är särskilt personliga, t.ex. anteckningar och dagböcker
  • Känsliga artdata, t.ex. information om utrotningshotade djur och växter, information om naturskydd eller information om biosäkerhet.
  • Annan konfidentiell information, till exempel patent, information om landets försvar, organisatorisk information eller affärshemligheter.

Här behandlas de dolda riskerna i samband med att du säkerställer enhetlighet och kvalitet i forskningsmaterialet och hur riskerna kan hanteras. Observera att kvaliteten på forskningsmaterialet och kvaliteten på forskningsmetoden inte är samma sak.

Re­kom­men­da­tio­ner för bäs­ta prax­is

  • Använder du verktyg för hantering av forskningsmaterial, till exempel en databas avsedd för att samla material?
  • Har alla som hanterar materialet instruerats tillräckligt väl?
  • Är metoderna du använder validerade, använder du en kvalitetshandbok?
  • Kontrollerar någon transkriberingen av inspelade eller filmade intervjuer?
  • Använder ni kontrollsummor (programvara)?
  • Motsvarar det digitaliserade materialet det motsvarande fysiska eller analoga materialet med tillräcklig precision?
  • Bevaras den ursprungliga informationen även om information ändras eller konverteras för att passa ett annat system?
  • Fundera vid behov på hur minimering, pseudonymisering eller anonymisering påverkar kvaliteten på materialet.

toiseen?

Lakt­ta­gan­de av etis­ka prin­ci­per och lag­stift­ning

Innehåller ditt material personuppgifter? Utför du sådant arbete med djur som kräver etiskt tillstånd? Hanterar du en annan typ av sensitivt eller konfidentiellt material, t.ex. känsliga artdata, information om skyddsområden eller militären?  Finns det immaterialrättigheter kopplade till materialet, t.ex. upphovsrättigheter?

Hur uppfyller du de etiska kraven och hur följer du relevanta lagar i hanteringen av forskningsmaterialet? Vilka risker är förknippade med hanteringen av materialet och hur hanterar du dem?

Re­kom­men­da­tio­ner för bäs­ta prax­is

  • Motivera din rätt att samla, hantera och lagra material med innehåll som kan innebära etiskt ansvar. Ange t.ex. att en etisk förhandsprövning har utförts.
  • Om du behandlar personuppgifter (fler tips bakom länken):
    • Ange vem som behandlar uppgifterna och vem eller vilken organisation som är personuppgiftsansvarig (eller huruvida personuppgiftsansvaret är gemensamt).
    • Beskriv vilka slags personuppgifter du behöver och varför.
    • Specificera den rättsliga grunden för behandlingen av personuppgifter (vetenskaplig forskning av allmänt intresse, samtycke?).
    • Bedöm vilka risker som behandlingen av personuppgifter utgör för forskningspersonerna.
    • Bedöm behovet av en konsekvensbedömning (använd formuläret för preliminär konsekvensbedömning om dataskydd).
    • Gör en konsekvensbedömning vid behov.
    • Beskriv hur du ämnar skydda materialet som behandlas och forskningspersonernas integritet, och hur du vid behov kommer att anonymisera eller pseudonymisera (på engelska) data.
    • Bedöm hur du kommer att tillgodose forskningspersonernas (de registrerades) rättigheter (inklusive att informera dem).
    • Beskriv hur du ämnar radera onödiga uppgifter och vad som händer efter undersökningen.

Vad har ni kommit överens om beträffande rättigheterna att använda forskningsmaterialet? Har någon tredje part rättigheter till forskningsmaterialet? Med vilken licens ska forskningsmaterialet publiceras?

Ägan­de­rätt och li­cen­ser

  • Äganderätten till forskningsdata beror på forskningsfinansieringen. Se till att de nödvändiga avtalen ingås i början av projektet (äganderätt och upphovsrätt). 
  • Använd licens när du gör dina data tillgängliga för återanvändning (t.ex. forskningsdata, kod, programvara).
    • HU rekommenderar licensen CC0 för forskningsdata. Då avstår du från dina rättigheter till materialet. Du behåller dina moraliska rättigheter och till god vetenskaplig sed hör fortsättningsvis att upphovspersonen anges. Alternativa licenser:
    • Helsingfors universitets biblioteks guide till Creative Commons-licenser (på engelska)
    • GNU- eller MIT-licenser (på engelska)
Do­ku­men­tation och metadata

Dokumentation innebär att beskriva sitt material med dokument som visar vilket material som används i projektet och hur det har tillkommit.

Till dokumentationen hör bland annat datakataloger (som förklarar variabler och koder) och README-filer. Annat viktigt är t.ex. filnamnskonventioner, versionskontroll och katalogstruktur. Det finns standardiserade dokumentationsförfaranden, s.k. metadatastandarder, som kan användas om de lämpar sig för datamaterialet.

Re­kom­men­da­tio­ner för bäs­ta prax­is

  • Metadatastandarder: Många arkiv kräver att en specifik standard följs. Om du på förhand vet var du kommer att publicera materialet lönar det sig för dig att kontrollera standardkraven.
  • Programvara för datahantering (t.ex. databaser, elektronisk laboratoriedagbok).
  • En datakatalog eller termlista där de använda variablerna, termerna, förkortningarna och måttenheterna förklaras, eller en kodbok där de koder och algoritmer som använts i projektet beskrivs.
  • Filnamnskonventioner
  • Katalogstruktur
    • Kom ihåg att också metadata, t.ex. namn på filer, kataloger och variabler kan innehålla persondata och känslig information
  • README-filer som beskriver innehållet i filerna för att säkerställa att det tolkas korrekt.
  • Versionskontroll
Lag­ring och åt­komst­kon­troll

Var ska materialet lagras och säkerhetskopieras (på finska) under forskningsprojektets gång? Vem ansvarar för säkerhetskopiering? Gör upp en plan med dina samarbetspartner och se till att dataöverföringen och delningen sker på ett säkert sätt.

Re­kom­men­da­tio­ner för bäs­ta prax­is

  • Använd dig av Helsingfors universitets IT-centers tjänster: storing solutions table (på engelska).
    • Ytterligare information: HelpdeskCSC (på engelska, datalagring)
    • Du kan t.ex. använda personligt lagringsutrymme eller grupplagringsutrymme (på engelska) som administreras av HU:s IT-center och säkerhetskopieras en gång i timmen. 
    • Molntjänster: Använd HU:s One Drive for Business eller Teams molntjänster i stället för kommersiella tjänster (t.ex. Google Drive/Dropbox).
    • ANVÄND INTE externa hårddiskar som primär lagringsplats.

Kontrollera att ditt projekt har tillgång till tillräckligt med lagringskapacitet. Om det behövs mer diskutrymme ska du kontakta Helpdesk, tfn +358 (0)2 941 55555 eller helpdesk@helsinki.fi.

Om du arbetar med känsligt material:

  • Se till att det alternativ för lagring som du väljer är tillräckligt säkert för ditt material, t.ex. ett dedikerat och säkert lagringsutrymme som administreras av HU eller CSC (UMPIO, lagringsservrar, ePouta m.fl.).
  • Molntjänster har inte tillräckligt starkt dataskydd, använd inte sådana.
  • Kryptering: Använd kryptering enligt behov. Framför allt mobila enheter, bärbara datorer och externa lagringsenheter bör krypteras, t.ex. med Cryptomator.
  • Kontakta datasupport@helsinki.fi om du har frågor om dataskydd.
  1. Vem reglerar åtkomsten till datamaterialet?
  2. Hur regleras åtkomsten? Används en it-lösning (t.ex. behörighet skyddad med lösenord, användarlogg) eller en fysisk lösning (t.ex. arkivskåp)?
  3. Vem i forskningsgruppen har tillgång till vilka data?
  4. Varför har behörigheterna (ändra, visa, radera) beviljats?
  5. Redogör för hur datasäkerheten och riskerna vid behandling av känsligt material har tagits i beaktande. Förvaras materialet krypterat? Nedan finns fler tips.

Re­kom­men­da­tio­ner för bäs­ta prax­is

  • Om du använder personligt eller delat lagringsutrymme på en nätverksdisk kan du enkelt administrera behörigheter.
  • Åtkomstkontroll ska ägnas särskild uppmärksamhet när det gäller känsliga uppgifter. Materialet måste hanteras och överföras enligt villkoren i samtycket som getts.
  • Åtkomstkontroll: Det måste finnas en lista över användare och beviljade behörigheter, och även ett förfarande för att återkalla och radera behörigheter.
  • Övervakning: Hur kommer användningen av materialet att övervakas under forskningsprojektet? Kan den tekniska utrustningen registrera vem som använde material, vilket material som användes och när det användes? Fråga it-stödet vid din organisation om det finns verktyg med användarlogg eller ändringslogg som du kan använda.
  • Fastighetssäkerhet: Kontrollera låssystemen, säkra förvaringslösningar, kameraövervakning och passerkontroll i fastigheten.
Till­gäng­lig­gö­ran­de och lång­tids­be­va­ring ef­ter av­slu­tat forsk­nings­pro­jekt

Vilka delar av materialet ska göras tillgängliga eller publiceras? Var ska materialet göras tillgängligt? Ange repositorierna.  När blir materialet tillgängligt? Ska någon del av materialet raderas eller förstöras?

Om ditt material inte kan göras tillgängligt, motivera varför och berätta var projektets metadata kommer att publiceras.

  • Dina möjligheter att tillgängliggöra och dela personuppgifter regleras bland annat av den information som forskningspersonerna får när uppgifterna samlas in, huruvida forskningspersonen har gett sitt uttryckliga samtycke samt i vilken form och för vilket ändamål uppgifterna delas eller görs tillgängliga.
    • När du gör materialet tillgängligt måste du säkerställa att uppgifterna är ordentligt skyddade och uppgifterna ska om möjligt pseudonymiseras eller anonymiseras.
    • För tillgängliggörande av material där forskningspersonerna är direkt identifierbara krävs personernas samtycke.
    • Materialet kan i vissa fall delas för ändamål som överensstämmer med det ursprungliga.
      Kontakta juristerna vid universitetets forskningsservice (researchlawyers@helsinki.fi) om du planerar att dela material som innehåller personuppgifter.
  • Även om materialet innehåller personuppgifter och därför inte kan göras öppet tillgängligt, kan metadata (på engelska) som inte innehåller känsliga uppgifter tillgängliggöras.

Re­kom­men­da­tio­ner för bäs­ta prax­is

  • Välj de repositorier som passar bäst för att dela och tillgängliggöra ditt material redan i början av forskningsprojektet. Se också till att ditt material uppfyller de krav som ställs av tjänsten du valt.
  • “Forskningsdata som anknyter till forskningsrön som har producerats och publicerats vid Helsingfors universitet är i princip i gemensam användning och öppet tillgängliga. Materialet ska vara sökbart och förses med uppgifter som möjliggör referenser till det.” (Helsingfors universitets forskningsdatapolicy)
  • Var ska du publicera ditt material?
    • Kontrollera vad som rekommenderas av förlag, vetenskapliga samfund och finansiärer inom ditt vetenskapsområde.
    • Var har du eller dina kolleger tidigare publicerat material? 
    • Sök lämpliga repositorier på re3data.org.
    • Allmänna repositorier: IDA, Zenodo (på engelska),  Dryad (på engelska),  Figshare (på engelska).
  • Om du inte kan göra ditt material tillgängligt ska du ändå publicera forskningsmaterialets metadata. Använd till exempel Zenodo (på engelska) eller det finländska Etsin (på engelska och finska).
  • Välj repositorier som använder beständiga identifierare (på engelska) (DOI, URN).
  • Kom ihåg att licensiera dina data (se punkt 2.2).

Redogör för var datamaterial av långsiktigt värde ska bevaras och hur länge.

  • Vilken del av materialet ska bevaras?
  • Var ska det bevaras?
  • Hur länge ska det bevaras?
  • Kostar arkiveringen? Vem står för kostnaderna?
  • Ska någon del av materialet förstöras?

En arkiveringsplan bidrar till att säkerställa forskningens kvalitet och förfarandets transparens.

Re­kom­men­da­tio­ner för bäs­ta prax­is

  • Det är viktigt att överväga och fatta beslut om materialets förvaringstid i takt med att nytt material genereras under forskningsprojektets gång.
  • Kom ihåg att kontrollera vilka krav förlaget ställer på förvaringstiden, om du planerar att publicera i en tidskrift som förutsätter att du gör datamaterialet öppet tillgängligt.
  • Glöm inte att kontrollera vilka rekommendationer som gäller för olika finansiärer och vetenskapsområden.
  • Personuppgifter kan också bevaras. När forskningsmaterial som innehåller personuppgifter överförs till arkivet ska uppgifter som identifierar enskilda individer avlägsnas i så stor utsträckning som möjligt om det inte finns grunder för att bevara dem på grund av uppgifternas natur. Forskningspersonerna ska också meddelas om arkiveringen och om grunderna för den. Vid arkiveringen måste man fortsättningsvis fästa vikt vid att skydda personuppgifter genom ändamålsenlig åtkomstkontroll.
    • Helsingfors universitet erbjuder vägledning i valet av säkra lösningar för att lagra och bevara material. Om du kommer att bevara känsliga personuppgifter, kontakta datasupport@helsinki.fi.
  • Biologiska prover kan arkiveras i en biobank.
  • För material som är värdefullt på en nationell nivå finns tjänsten Fairdata-PAS (på engelska) där material kan bevaras från tiotals till hundratals år.
An­svar och re­sur­ser vid han­te­ring av forsk­nings­da­ta

Vem ansvarar för hanteringen av forskningsdata (forskningsmaterial)? Vem ansvarar för och övervakar dataskydd och datasäkerhet? Vilka resurser (tid och arbetsmängd) behövs för hanteringen av forskningsdata?

Re­kom­men­da­tio­ner för bäs­ta prax­is

  • Ansvarar en specifik person för hanteringen av forskningsdata eller delar hela forskningsgruppen på ansvaret?
  • Vem ansvarar för att alla har fått tillräckligt ingående anvisningar och att ni kommit överens om gemensam praxis?  

Beskriv vilka resurser (tid och arbetsmängd) som behövs för hanteringen av forskningsdata. Ju bättre hanteringen av forskningsdata har planerats och skötts redan i början av forskningsprojektet och under dess gång, desto mindre arbetsmängd krävs när materialet ska göras tillgängligt och arkiveras.

  • Bedöm huruvida det behövs experthjälp/en assistent för hantering, förvaring och tillgängliggörande av data.
  • Bedöm hur mycket tid som krävs för dokumentation och rensning av datamaterialet (inte resultaten) för att det ska kunna publiceras: Till exempel: 1–2 timmar per vecka, 1 dag per månad, 1–2 veckor före publiceringen eller motsvarande.
    • Dokumentation och rensning innebär bland annat att skapa metadata (se avsnitt 3.1), anonymisera material som innehåller känsliga uppgifter och att ordna och överföra material.
    • Det rekommenderas att man uppdaterar dokumentationen under hela forskningsprojektet.

I budgeten ska du specificera kostnaderna för arkivering, tillgängliggörande och publicering av datamaterial enligt finansiärens krav.