Hantering av forskningsdata

Vi ger stöd i hantering av forskningsdata (används här synonymt med forskningsmaterial) under forskningens hela livscykel, inklusive hur organisera, förvara och dela data. I dessa webbsidor hittar du handledning i detta och också hur du skall besvara frågor i datahanteringsplaner (DMP – Data Management Plan).

 

Vid Helsingfors universitet iakttas forskningsetiska anvisningar om hantering av och öppen tillgång till forskningsdata. Helsingfors universitet erbjuder forskare och forskningsgrupper en forskningsdatainfrastruktur som omfattar verktyg och tjänster som stöder hantering, användning, sökbarhet och distribution av forskningsdata samt lagrings-, beräknings- och behandlingskapacitet.

Helsingfors universitets datastöd hjälper forskare med hantering av forskningsdata. Datastödet består av ett nätverk experter från universitetets bibliotek, IT-stödet, centralarkivet, forskningsservicen, personaltjänsterna och den juridiska servicen. Du kan kontakta oss per e-post på datasupport(at)helsinki.fi.

På denna sida hittar du Helsingfors universitets anvisning om hantering av forskningsmaterial. 

RDM_services_UH_grey

CC BY 4.0 University of Helsinki

En datahanteringsplan ska beskriva hur forskningsmaterialet kommer att hanteras medan forskningsprojektet pågår och efter den aktiva fasen. Planen ska uppdateras i takt med att forskningsprojektet framskrider.

Datahanteringsplanen kompletterar forskningsplanen. För att undvika upprepningar kan du i din datahanteringsplan hänvisa till forskningsplanen och vice versa. Analysen och metoderna ska beskrivas i forskningsplanen.

I datahanteringsplanen kan följande betraktas som forskningsdata (forskningsmaterial):

  • material som samlats in med olika metoder (prover, enkäter, intervjuer, mätningar, bedömningar, avbildningsmetoder osv.)
  • material som genererats under forskningsprocessen (t.ex. analyserat material)
  • annat källmaterial (t.ex. arkivmaterial)
  • källkoder och program.

Du kan använda det öppet tillgängliga programmet DMPTuuli för att skapa din datahanteringsplan. Punkterna 1–6 som presenteras i listan nedan utgör Helsingfors universitets anvisning om datahanteringsplaner. Öppet tillgängliga datahanteringsplaner som skrivits av forskare vid Helsingfors universitet finns i Zenodo.

DMP whats in it for me

CC BY 4.0 University of Helsinki

Allmän beskrivning av forskningsmaterialet

Vilket material används och produceras i forskningen? Vilka filformat har de olika delarna av materialet? Hur mycket diskutrymme/minne behövs för materialet? Använder ni speciella program eller utvecklar ni egna?

Rekommendationer för bästa praxis

Se anvisningen under exemplen om du kommer att hantera sensitiva data. Kategorisera ditt material i en punktlista eller tabell enligt följande anvisningar.

Exempel 1:

Material som ska samlas in för forskningsprojektet

  • Enkät x, filformat .pdf, storlek 5 GB
  • DNA-prov (n=500)
  • Bilder/videor av x, filformat .jpg, .avi, storlek 1 TB

Material som forskningsprojektet ger upphov till

  • Analyser av enkätsvar, .pdf, .xslx, 2 GB
  • DNA-sekvens/analys, FASTA, .txt, .xslx, 2 TB
  • Dokumentationsmaterial (laboratoriedagbok, kodbok, readme-filer)

Material som tidigare samlats in

  • Prover från Biobanken
  • Material x från Statistikcentralen, databas, 10 GB

Exempel 2:

Typ av data

Källa

Filformat

Känslig data

Storlek

Enkät x

insamlad data

.csv, .txt, .docx

nej/ja

1 Gb

Analys av
enkät x

producerad data

.xslx, .tif

 

100 Mb

DNA prov

återanvända data från Biobank

 

 

 

Ytterligare anvisning om använding av sensitive data

Det är särskilt viktigt att identifiera sensitiva (känsliga) data, eftersom man i datahanteringsplanen skall identifiera och hantera riskerna som är förknippade med sådan information. När det gäller personuppgifter: ange vilken person eller organisation som är personuppgiftsansvarig. Mer information: Dataskyddsanvisning för forskare (Flamma)

Känsliga data är information som kan orsaka skada om den avslöjas. Sådan information är till exempel:

  1. Känsliga personuppgifter; det är inte möjligt att göra en omfattande lista över känsliga personuppgifter. Forskaren bär själv ansvaret för att identifiera uppgifter som kan vara till skada för forskningspersonerna om de avslöjas. Känslig information kan till exempel vara uppgifter om ras eller etniskt ursprung, politiska åsikter, religiös eller filosofisk övertygelse, medlemskap i en fackförening, hälsa, en persons sexualliv eller sexuella läggning, genetiska uppgifter, biometriska uppgifter som entydigt identifierar en person.
  2. Känsliga artdata, t.ex. information om utrotningshotade djur och växter, information om naturskydd eller information om biosäkerhet.
  3. Annan konfidentiell information, till exempel patent, information om landets försvar, organisatorisk information eller affärshemligheter.

Personuppgifter är alla de uppgifter som kan identifiera en person, antingen direkt eller indirekt.

  • Exempel på direkt identifierande uppgifter: namn, telefonnummer, personbeteckning, fotografi, röst, fingeravtryck, tandkarta.
  • Exempel på indirekt identifierande uppgifter: kön, ålder, utbildning, yrkesställning, nationalitet, platsinformation, arbetshistoria, logginformation från system, civilstånd, bostadsort, bilars registreringsnummer.

 

Enhetlighet och kvalitet

Här behandlas de dolda riskerna i samband med att du säkerställer enhetlighet och kvalitet i forskningsmaterialet och hur riskerna kan hanteras. Observera att kvaliteten på forskningsmaterialet och kvaliteten på forskningsmetoden inte är samma sak.

Rekommendationer för bästa praxis

  • Använder du verktyg för hantering av forskningsmaterial, till exempel en databas avsedd för att samla material?
  • Har alla som hanterar materialet instruerats tillräckligt väl?
  • Är metoderna du använder validerade, använder du en kvalitetshandbok?
  • Kontrollerar någon transkriberingen av inspelade eller filmade intervjuer?
  • Använder ni kontrollsummor (programvara)?
  • Motsvarar det digitaliserade materialet det motsvarande fysiska eller analoga materialet med tillräcklig precision?
  • Bevaras den ursprungliga informationen även om information ändras eller konverteras för att passa ett annat system?
  • Fundera vid behov på hur minimering, pseudonymisering eller anonymisering påverkar kvaliteten på materialet.

Etiska frågor kring hanteringen av forskningsmaterial

Innehåller ditt material personuppgifter? Utför du sådant arbete med djur som kräver etiskt tillstånd? Hanterar du en annan typ av sensitivt eller konfidentiellt material än de som nämns ovan (t.ex. känsliga artdata, information om skyddsområden eller militären)?

Hur uppfyller du de etiska kraven och hur följer du relevanta lagar i hanteringen av forskningsmaterialet? Vilka risker innebär etisk hantering av materialet och hur hanterar du riskerna? 

Rekommendationer för bästa praxis

  • Motivera din rätt att samla, hantera och lagra material med innehåll som kan innebära etiskt ansvar. Ange t.ex. att en etisk förhandsprövning har utförts.
  • Om du behandlar personuppgifter:
    • Ange vem som är personuppgiftsansvarig
       
      för materialet, om du inte redan gjort det i punkt 1.1.
    • Ange hur du skyddar forskningspersonernas integritet och anonymiserar eller pseudonymiserar uppgifterna.

 

Juridiska frågor som gäller hantering av forskningsmaterial

Vad har ni kommit överens om beträffande hur forskningsmaterialet ska användas? Har någon tredje part rättigheter till forskningsmaterialet? Hur ska ni med framtida samarbetspartner komma överens om på vilket sätt forskningsmaterialet används? Är forskningsmaterialet kopplat till något patent? Med vilken licens ska forskningsmaterialet publiceras?

Rekommendationer för bästa praxis

Närmare anvisningar om licenser och rätt till forskningsmaterial:

  • Uppge tydligt vilken person/organisation eller vilka personer/organisationer som äger materialet. Ange vid behov att alla forskare som deltar i projektet har skrivit under avtal om att överföra sin rätt till materialet, och att ni med universitetets externa partner kommit överens om vem som äger rättigheterna till forskningsmaterialet. Kom också överens om författarskap i början av projektet. Genom att avtala om rättigheterna till forskningsmaterialet och publikationers upphovsmannaskap förebygger du att det senare uppstår tvister om användningen av materialet.
    • Kom ihåg att flera finansiärer (bl.a. Finlands Akademi, EU) kräver att rätten till materialet ska överföras till universitetet. Du ser väl till att ni ingår de avtal som behövs.
    • Helsingfors universitet äger inte det material som samlas in av universitetets forskare, om man inte separat kommit överens om det. De ansvariga forskarna ansvarar för att avtal som gäller ägande- och nyttjanderätt till de material som forskningen genererar görs upp i ett så tidigt skede som möjligt [Helsingfors universitets forskningsdatapolicy].
    • Anvisningar för ingående av avtal (Flamma)
  • Berätta under vilken licens materialet kommer att göras tillgängligt. Universitetet rekommenderar licensen CC 0, som ger användaren rätt att fritt använda materialet. Du har ändå moralisk upphovsrätt och till god vetenskaplig praxis hör fortsättningsvis att upphovspersonen nämns. Andra licenser: Creative Commons: information om licenser & verktyg för att välja licensGNU-licens, MIT-licens eller andra licenser.

Dokumentation innebär att beskriva sitt material med dokument som visar vilket material som används i projektet och hur det har tillkommit.

Till dokumentation hör bland annat handlingar där variabler och koder förklaras (data lexikon och kodböcker), readme-filer, filnamnskonvention, versionskontroll och katalogstruktur. Det finns standardiserade förfaranden för dokumentation. Genom att följa dem ger du ditt material mervärde och gör det lättare att återanvändas.

Rekommendationer för bästa praxis

  • Standard för metadata: Många arkiv kräver att en specifik standard följs. Om du på förhand vet var du kommer att publicera materialet efter att projektet slutförts lönar det sig för dig att kontrollera standardkraven.
  • Programvara för databaser och hantering av forskningsmaterial (t.ex. elektronisk laboratoriedagbok).
  • En termlista där de använda variablerna, termerna, förkortningarna och måttenheterna förklaras, eller en kodbok där de koder och algoritmer som använts i projektet beskrivs.
  • Namngivningskonventioner för filer.
  • Katalogstruktur: Kom ihåg att också filnamn, namn på kataloger, variabler och metadata kan innehålla personuppgifter eller annan känslig information.
  • README-filer som beskriver innehållet i filerna för att försäkra sig om att det tolkas korrekt.
  • Versionshantering.

Dokumentationshandbok för forskare (på engelska)

Lagring och säkerhetskopiering under forskningsprojektets gång

Var ska materialet lagras och säkerhetskopieras under forskningsprojektets gång? Vem ansvarar för säkerhetskopiering och återställning? Gör upp en plan med dina samarbetspartner och se till att information överförs och delas på ett säkert sätt.

Rekommendationer för bästa praxis

Använd dig av Helsingfors universitets IT-centers tjänster för lagring med automatisk säkerhetskopiering.

  • Personligt lagringsutrymme/grupplagringsutrymme som administreras av HU:s IT-center och säkerhetskopieras en gång i timmen.
  • Någon annan av HU:s lösningar för lagring, t.ex. en virtuell server eller ett eget lagringssystem.
  • CSC-tjänster för lagring av material.
  • Molntjänster: Använd HU:s molntjänster OneDrive for Business eller team molnet i stället för externa tjänster eller konsumenttjänster (t.ex. Google Drive eller Dropbox).
  • Kontrollera att ditt projekt har tillgång till tillräckligt med lagringskapacitet. Du får mer diskutrymme genom att kontakta Helpdesk, tfn 02 941 55555 eller helpdesk@helsinki.fi.
  • ANVÄND INTE externa hårddiskar som primärt lagringsutrymme.

Om du arbetar med känsligt material:

  • Se till att det alternativ för lagring som du väljer är tillräckligt säkert för ditt material, t.ex. UMPIO (HU), Virtual storage server (HU), Private storage server (HU), NetApp storage cluster (HU), ePouta (CSC).
  • Molntjänster har inte tillräckligt starkt dataskydd, använd inte sådana.
  • Använd kryptering enligt behov. Framför allt mobila enheter, bärbara datorer och externa lagringsenheter bör krypteras. T.ex. Cryptomator kan användas.
  • Kontakta datasupport@helsinki.fi om du har frågor om att skydda material.

 

Åtkomstkontroll

  1. Vem ansvarar för åtkomstkontroll (ange namnet)?
  2. På vilket sätt sköts kontrollen i praktiken? Används en it-lösning (t.ex. behörighet skyddad med lösenord, användarlogg) eller en fysisk lösning (t.ex. arkivskåp, kassaskåp)?
  3. Vem i forskningsgruppen har behörighet till vilket material?
  4. Varför har behörigheterna (ändra, visa, radera) beviljats?
  5. Berätta på vilket sätt datasäkerheten och riskerna vid behandling av känsligt material har tagits i beaktande. Förvaras materialet till exempel krypterat? Nedan finns fler tips.

Rekommendationer för bästa praxis

  • Om du använder personligt eller delat lagringsutrymme på en nätverksdisk kan du enkelt administrera behörigheter.
  • När det gäller känsligt material är det viktigt att ägna särskild uppmärksamhet åt åtkomstkontroll. Materialet måste användas och överföras enligt villkoren i de tillstånd som finns.
  • Åtkomstkontroll: Det måste finnas en lista över användare och beviljade behörigheter, och även ett förfarande för att återkalla och radera behörigheter.
  • Övervakning: Hur kommer användningen av materialet att övervakas under forskningsprojektet? Kan den tekniska utrustningen registrera vem som använde material, vilket material som användes och när det användes? Fråga it-stödet vid din organisation om det finns verktyg med användarlogg eller ändringslogg som du kan använda.

Fastighetssäkerhet: Kontrollera låssystemen, säkra förvaringslösningar, kameraövervakning och passerkontroll i fastigheten.

Att göra materialet tillgängligt

Vilka delar av materialet ska göras tillgängligt eller publiceras? I vilket dataarkiv ska materialets olika delar publiceras? När blir materialet tillgängligt? Ska någon del av materialet raderas eller förstöras?

Kan ditt material inte göras tillgängligt (helt eller delvis)? Motivera varför och berätta var materialets metadata kommer att publiceras.

  • Material som innehåller personuppgifter kan göras tillgängligt endast om uppgifterna anonymiserats. Om uppgifterna pseudonymiserats innehåller materialet fortfarande personuppgifter och kan därför INTE göras tillgängligt, om forskningspersonerna inte uttryckligen gett sitt samtycke till det.
  • Material som innehåller personuppgifter kan i vissa fall delas för ändamål som överensstämmer med den ursprungliga behandlingsgrunden. Kontakta juristerna vid universitetets forskningsservice (forskningsjurister@helsinki.fi) om du planerar att dela material som innehåller personuppgifter.
  • Metadata bör ändå kunna publiceras även om själva materialet innehållande personuppgifter inte kan öppnas.

 

  • Rekommendationer för bästa praxis
  • Välj de tjänster som passar bäst för att dela och öppna ditt material redan i början av forskningsprojektet. Se också till att ditt material uppfyller de krav som ställs av tjänsten du valt. Välj en tjänst som använder beständiga identifierare (DOI, URN).
  • “Forskningsdata som anknyter till forskningsrön som har producerats och publicerats vid Helsingfors universitet är i princip i gemensam användning och öppet tillgängliga. Materialet ska vara sökbart och förses med uppgifter som möjliggör referenser till det.” [Helsingfors universitets forskningsdatapolicy]
  • Var ska du publicera ditt material? Kontrollera vad som rekommenderas av förlag, vetenskapliga samfund och finansiärer inom ditt vetenskapsområde. Var har dina kolleger publicerat sitt material? Var har du själv tidigare publicerat material? 
    • Du kan till exempel använda tjänsten re3data.org för att söka efter tjänster som passar för specifika typer av material.
    • Allmänna repositorier är till exempel IDAZenodoDryad och Figshare
    • Om du inte kan göra ditt material tillgängligt ska du ändå publicera forskningsmaterialets metadata. Använd till exempel Zenodo eller finländska Etsin

 

Långtidsbevaring av material

Om ditt material har ett långsiktigt värde: 

  1. Vilken del av materialet ska arkiveras?
  2. I vilket arkiv ska materialet bevaras?
  3. Hur länge bevaras materialet i arkivet?
  4. Kostar arkiveringen och vem står för kostnaderna?
  5. Ska någon del av materialet förstöras?

En arkiveringsplan hjälper till att se till att forskningen har god kvalitet och förfarandet är transparent.

Rekommendationer för bästa praxis

  • Det är viktigt att överväga och fatta beslut om materialets förvaringstid i takt med att nytt material genereras under forskningsprojektets gång.
  • Kom ihåg att kontrollera vilka krav förlaget ställer på förvaringstiden för material som används för publikationer.
  • Glöm inte att kontrollera vilka rekommendationer som gäller för olika finansiärer och vetenskapsområden.
  • Traditionellt brukar man uppmanas förstöra känsligt material efter forskningsprojektet. Enligt dataskyddsförordningen (GDPR) är detta dock ofta inte nödvändigt, men av den information som ges till forskningspersonerna ska framgå hur uppgifterna bevaras och arkiveras samt varför en specifik bevaringstid har valts. Vid Helsingfors universitet erbjuds vägledning i valet av säkra lösningar för att lagra och bevara material. Om du kommer att bevara känsliga personuppgifter kontakta datasupport@helsinki.fi.
  • Biologiska sampel kan arkiveras i en biobank.
  • För material som är värdefullt på en nationell nivå finns tjänsten Fairdata-PAS där material kan bevaras från tiotls till hundratals år. Mer information om HU:s tjänst FAIRdata-PAS finns här.

Vem ansvarar för hanteringen av forskningsmaterial? Vem ansvarar för och övervakar dataskydd och datasäkerhet? Vilka resurser (tid och arbetsmängd) behövs för hanteringen av forskningsmaterial?

Ju bättre hanteringen av forskningsmaterial har planerats och skötts redan i början av forskningsprojektet och under dess gång, desto mindre arbetsmängd krävs då materialet ska göras tillgängligt och arkiveras.

Rekommendationer för bästa praxis

  • Ansvarar en specifik person för hanteringen av forskningsmaterial eller delar hela forskningsgruppen ansvaret? Vem ansvarar för att alla har fått tillräckligt ingående anvisningar och att ni kommit överens om gemensam praxis?
  • Behöver ni experthjälp eller en anställd när ni hanterar, lagrar och delar materialet?
  • Uppskatta hur mycket tid som krävs för rensning och dokumentation av datamaterialet (inte resultaten) för att det ska kunna publiceras. Till exempel: 1–2 timmar per vecka, 1 dag per månad, 1–2 veckor före arkiveringen eller motsvarande.
    • Rensning och dokumentation innebär bland annat att skapa metadata (se avsnitt 3.1), anonymisera forskningsmaterial som innehåller känsliga personuppgifter och att välja, ordna och överföra material.
    • Det rekommenderas att man uppdaterar dokumentationen under hela forskningsprojektet.

I budgeten ska du specificera kostnaderna för hanteringen av forskningsmaterial enligt finansiärens anvisningar.