Metadata, eller beskrivande data, innehåller som namnet antyder information om data. Typiska metadata är namnet på data, upphovsmännen, tidpunkten för skapandet, datatypen, beskrivningar av de variabler som används eller den programvara som kan behövas för att öppna data. Metadata kan delas in i metadata som stöder upptäckbarheten av data och metadata som stöder begripligheten eller återanvändningen av data. Exempel på metadata som stöder upptäckbarheten är namnet på skaparen, disciplinen och nyckelord som beskriver data. Metadata som stöder återanvändningen av data omfattar förklaringar av de variabler som används och information om hur data samlades in.
Omfattande metadata om forskningsdata är av avgörande betydelse för vidareutnyttjandet av data.
En bra titel är tydlig, informativ och identifierar uppgifterna. Den ger en omedelbar uppfattning om vad uppgifterna innehåller och vilken typ av forskning det rör sig om. Här följer några förslag på hur du kan skriva en bra titel:
Titlar som följer dessa riktlinjer skulle till exempel kunna vara
Undvik titlar som säger lite om själva datan, till exempel ”All data up to 2000” eller ”E. coli-mätningar”.
Viktiga punkter i sammanfattningen för forskningsdata:
Vi har valt ut några exempel på metadata för forskning per typ av data. Du kan ta exempel från dem eller använda det kortfattade exemplet nedan.
Ett bra exempel på ett abstrakt för forskningsdata:
Ett omfattande exempel på ett abstract för forskningsdata: Detta dataset innehåller mätningar av luftföroreningar som samlats in i Helsingfors 2023. Datauppsättningen består av PM2.5- och PM10-koncentrationer som uppmätts vid 15 olika stationer med timintervall från 1 januari till 31 december 2023. Uppgifterna samlades in av sensorenheter i nätverket för mätning av luftkvalitet i huvudstadsregionen och finns tillgängliga i CSV- och JSON-format. Uppgifterna kan användas för att analysera luftkvalitetstrender och för stadsplanering. Användningen av data är öppen, men en hänvisning till originalkällan är obligatorisk.
En bra README-fil ger nyckelinformation för vidare användning. Vi har skapat en mall för README-filen baserad på imaginära data. Du kan ladda ner och ändra den så att den passar ditt eget bruk. Ytterligare information kan omfatta den programvara som används för att öppna filerna, datainsamlingsmetoder och instrument, antalet observationer och variabler, vilken typ av mätinstrument som används och dess tillverkare.
Proveniens avser historiken för skapande och ändring av uppgifterna. Proveniensinformation bör till exempel innehålla information om modifiering av data, korrigering, uppdelning av data i delar eller kombination av data med andra dataset.
Information om dataprovanens kan innehålla information som:
Information om dataskapande och datakälla
Origin:
Bearbetning och omvandling av data
Databidragare och roller
Ändringar av data
Begränsad tillgång till forskningsdata innebär att data i fråga inte är fritt tillgängliga för alla, till exempel kan de inte laddas ner direkt från ett arkiv, utan tillgång måste begäras. Det finns vanligtvis restriktioner för användning och delning av sådana data. Dessa begränsningar kan ha flera olika orsaker, t.ex:
Begränsad tillgång innebär inte automatiskt att data inte kan göras tillgängliga under några omständigheter. Det betyder bara att tillgång till uppgifterna måste begäras. Vanligtvis har datalagren en enkel process för detta, där det ingår att förklara varför uppgifterna begärs och vad de ska användas till.