Forskningsinitiativ inom datafiering 2021–2026, programplan

Initiativet för samman ett mångvetenskapligt samfund av forskare för att hantera de uppstående möjligheterna och problemen kring datafiering.

Forskningsinitiativet inom datafieringen av samhället vid Institutet för humaniora och samhällsvetenskap (HSSH) och forskningen inom humaniora och samhällsvetenskaper fokuserar på möjligheterna och utmaningarna som föranleds av dataintensiva, digitaliserade infrastrukturer som utvecklas snabbt. I enlighet med institutets mission stöder programmet mångvetenskaplig forskning som fokuserar på ”datafiering”

  • som en social och kulturell process som formar mönstren av interaktion och informationsspridning i samhällen, och/eller
  • som en utvecklande kontext för samhällsvetenskaper och humaniora som öppnar upp nya metodologiska möjligheter, tar upp centrala epistemologiska frågor och kräver kontinuerlig etisk och rättslig reflektion.

Denna programplan utgör en utgångspunkt och ett preliminärt område av frågor för forskare inom humaniora och samhällsvetenskaper som är intresserade av initiativet och delaktiga i det. Att förstå ”datafiering” som en sammanhängande sociokulturell utmaning och en ny förutsättning och möjlighet för forskningen inom humaniora och samhällsvetenskaper visar på ett växande forskningsfält av aktörer, intressen och teman. För att uppmuntra en mångvetenskaplig insats för att studera detta område är syftet med planen att beskriva forskningsinitativet utan att förankra sig till någon specifik disciplins vokabulär eller ett specifikt teoretiskt perspektiv.

Aspekterna, temana och frågorna som tas upp i planen pekar mot kärnan av humaniora och samhällsvetenskaper. Datafieringen av samhället och forskningen inom humaniora och samhällsvetenskap strävar efter att inspirera och aktivera hela forskarsamfundet för att fästa uppmärksamhet vid sätten på vilka den metodologiska, epistemologiska, rättsliga, etiska och politiska miljön inom forskning i humaniora och samhällsvetenskap håller på att förändras. För att bemöta den utmaning som de föränderliga infrastrukturerna för social interaktion och den alltmer dataintensiva miljön medför, behövs en omfattande kollektiv insats och den fulla intellektuella kraften inom olika vetenskapliga perspektiv.

Planen är indelad i tre sinsemellan relaterade avsnitt, som börjar med en analytisk arbetsdefinition av datafiering, och sedan identifierar dess allmänna samhälleliga utmaningar, och till slut formulerar mer specifika, kritiska frågor för humaniora och samhällsvetenskaper.

Datafiering: en arbetsdefinition

Digitaliseringen av infrastrukturerna kring social och kulturell interaktion har stadigt trappat upp under de senaste årtiondena. ”Datafiering” är en term som har uppkommit i populär, politisk och akademisk diskurs de senaste åren för att begreppsliga det nya skedet av denna förändring.

I kärnan av konceptet ligger den exponentiella ökningen av volymen av digitala data. Mängden digitala data har exploderat både på grund av den konstanta datainsamlingen som är inbyggd i vardagens gränssnitt och på grund av försöken att digitalisera avtrycken av mänsklig aktivitet (texter, audiovisuellt innehåll, dokumentering av offentliga register etc.) som inte från början producerats i digital form. Digitaliserade samhällen producerar, samlar in och arkiverar data i en oförutsedd skala (”big data”), vilket visar på den dominerande föreställningen att alla data och all information är råmaterial som är eller kan bli värdefullt. Följaktligen har typerna av data som samlas in och lagras ökat dramatiskt, och sträcker sig nu från individers åsikter, konsumentval, relationer inom sociala nätverk och rörlighet till fysisk information såsom puls eller ansiktsigenkänning och emotionell status, och så vidare. Att leva i en datafierad värld producerar dataavtryck konstant och ofta omedvetet.

Den digitala kompatibiliteten av dessa olika och kraftigt ökande informationsflöden presenterar ett kvalitativt sett nytt sätt att identifiera nya beteendemönster, interaktioner eller strukturer av betydelse och att följa dem i tid och rum. Detta gör det möjligt att ställa allt mer komplexa frågor om samhället och individer, och ger bättre färdigheter att förklara hur sociala och kulturella system fungerar, samt en ny nivå av exakthet för att profilera grupper och individuella aktörer.

Den samhälleliga effekten av denna nya volym, variation och kompatibilitet i fråga om digitala data är beroende av ökningen av dataanalysens beräkningskapacitet. Denna kapacitet innefattar både ett centrifugalt och ett centripetalt element. Å ena sidan har beräkningskapaciteten alltmer spridit sig i olika samhällen, vilket har gett individer och grupper bättre verktyg att (lokalt) tillgå kunskap och analysera tillgängliga och öppna datakällor. Å andra sidan kräver förmågan att utnyttja globala dataflöden massiv kapacitet (datainsamling, lagring, beräkningskraft) som har koncentrerat sig till ett fåtal aktörer (transnationella bolag och stater).

I en datafierad social situation är analysen av dataflöden också alltmer automatiserad, och förlitar sig på komplexa, ibland självutvecklande algoritmer som är sammanflätade med mänskligt beslutsfattande, och ibland ersätter det. Sådan automatiserad analys har även kvalitativt förändrat informationsflödenas hastighet och tidsmässiga dynamik och möjliggjort effektivare återkopplingar i det digitaliserade livet. Algoritmiskt analyserad, komplex profilering (baserad på många olika datapunkter) kan hjälpa att tjäna och hantera ”behoven” hos individer samt informationen och tjänsterna som de utsätts för, eller åtminstone i teorin öppna upp en terräng av prediktiv kunskap om individuellt beteende.

Datafiering i kulturen och samhället

Föga förvånande har datafieringens sociala förutsättningar gett upphov till både höga förväntningar och djup oro om typen av social förändring som dessa utvecklingar medför eller möjliggör. I dessa debatter erkänns förmågan att skörda och kontrollera stora mängder data som en ny maktresurs som i allt högre grad formar dagens sociala ordning. Detta är något som de som ställer sig optimistiskt och de som ställer sig kritiskt till utvecklingen av datafiering båda håller med om: extraheringen och analysen av data är avgörande för att hantera komplexiteten av dagens nätverksbaserade infrastrukturer (informationsspridning, inflytande, varor och tjänster osv.).

Följaktligen omorganiserar den dataintensiva miljön mänskliga relationer på en systemisk skala, och bryter gammal praxis och ger plats åt nya innovationer. Den ökande mångfalden av data som samlas in, ibland utan en tydlig uppfattning om vad de ska användas till, visar på en praktisk tro om att väsentliga särdrag som gäller individer eller mänskligt agerande kan fångas in genom att samla in och kombinera digitala data, och att mänskligt beteende kan förutses genom komplexa skärningspunkter i sådan information. Detta lyfter fram en dominerande social trend av att skräddarsy information, tjänster och andra åtgärder genom profilering som grundar sig på dataanalys. Å ena sidan ger sådana utvecklingar fungerande gränssnitt mellan institutioner och individer. Å andra sidan är sådana effektiva mekanismer aldrig ofarliga, utan de placerar sig alltid i specifika kontexter och sociala maktförhållanden.

En allt mer invasiv insamling av beteenderelaterade data lyfter även fram kritik som gäller privatlivets föränderliga gränser. Den lyfter även fram en större fråga om vilka aspekter och upplevelser som inte fångas in av det moderna samhällets dominerande dataflöden. En sådan fråga kan till exempel ge skäl att studera de oroväckande effekterna av snedvridna data i datafierade system, granska människors vägran att engagera sig i datafierade gränssnitt, fästa uppmärksamhet vid människors försök att skydda sina datarättigheter och sin integritet, eller att förhandla fram ”frivillighetsbaserade utrymmen” inom datafierad institutionell praxis.

Även om dataintensiv praxis kan ge löften om nya sätt att identifiera, förutse och svara på behov som ibland är väldigt specifika och kontextualiserade, utspelar sig denna kapacitet på olika sätt i olika situationer och områden (handel, administration, politiskt inflytande, hantering av arbetskraft osv.). Dataanalysens intersektionella logik kan också vara en kraftfull mekanism som stärker existerande sociala ojämlikheter, vilket tyder på ett behov av kontextbaserad bedömning av dataanvändning och social rättvisa.

Ett stort tecken på datafieringen är ökningen av dominerande, globala dataaktörer. Dessa innefattar privata företag som utan tvekan har uppnått en historiskt sett ny ställning, i och med att de tillhandahåller kärnan av den (globala) infrastrukturen för politisk, social och kulturell interaktion, vilket har väckt debatt och reaktioner i form av policy. I olika politiska regimer varierar förhållandet mellan staten och kommersiella aktörer, men makten över digitala infrastrukturer förlitar sig överallt på datautvinning, men också på kontroll av ogenomskinliga (”black box”-effekt) algoritmer som möjliggör hantering av dataflöden. Frågorna om ansvaret vid användning av algoritmer och artificiell intelligens sträcker sig från nivån av sociala system till specifika beslutskontexter, och tar upp svåra dilemman som gäller utbytets effektivitet, exakthet och rättvisa.

Nätverksbaserade infrastrukturer har på viktiga sätt gett styrka åt individer, samfund och rörelser (eller allmänheten), samtidigt som det finns en ständig oro över informationsloopar som främjar politisk polarisering, snedvridna informationsflöden och ekokammare. Diskussionerna om datafieringens roll i fråga om politisk, kulturell och social polarisering visar på vikten av att placera sådan forskning i kontexten av politisk splittring som har sin grund i mer omfattande samhälleliga utvecklingar och policyval.  Dock har den potentiella effektiviteten av återkopplingar som skapas av algoritmisk datakontroll och algoritmiska beslut skapat en ny miljö där sådan splittring utspelar sig. Om den tas tillräckligt långt, kan logiken av detaljerad profilering och möjligheten av prediktiv information om attityderna, reaktionerna och åsikterna hos specifika befolkningsgrupper de facto urholka den allmänna opinionens konceptuella bas.

Datafiering och forskning inom humaniora och samhällsvetenskap

Datafieringen lyfter fram nya metodologiska, epistemologiska, etiska och normativa frågor för forskare inom humaniora och samhällsvetenskap. Samtidigt visar de också på potentiella förändringar i ställningen av forskning inom humaniora och samhällsvetenskaper bland andra vetenskaper och i relation till den samhälleliga efterfrågan av forskningsbaserad kunskap.

Dataintensiv forskning påvisar nya möjligheter för att testa gamla teorier och utveckla nya, innovativa begreppsformeringar. Beräkningseffekten av digital analys kan stärka mer utforskande förhållningssätt i fråga om material som utgörs av stora dataset och producera nya kombinationer av kvalitativ och kvantitativ analys – och framställning av resultat.  Datafiering gör inte teori onödig, utan skapar de facto ett nytt behov för sådan.

Den ökande mångfalden av datakällor har erbjudit forskare inom humaniora och samhällsvetenskaper nya typer av information, och medfört nya bevisområden inom dessa vetenskapsområden (t.ex. spårning av fysiskt ”mätbara” reaktioner i sociala situationer, kartläggning av multimodala egenskaper i interaktion). Samtidigt kan digitaliseringen av gamla källor öppna upp gammalt material för en ny typ av analys, vilket också kan förbättra förståelsen av det förflutna. Att till fullo utnyttja dessa möjligheter berikar tydligt den förklaringskraft som forskning inom humaniora och samhällsvetenskaper har. Samtidigt måste forskare vara uppmärksamma i fråga om kvaliteten och relevansen av (nya) data, och även upprätthålla sina kunskaper om resultat och tolkningar som förblir utanför beräkningsbaserad analys och beteenderelaterade bevis.

Kompatibiliteten av olika datakällor erbjuder en kraftfull metod för att identifiera sociala problem, kulturella mönster, sociala grupper och identiteter, och tar fram nya typer av korrelationer och skärningspunkter mellan kulturella och sociala krafter. En sådan intersektionell analys kan påvisa en ny grad av samhällelig självförståelse. De etiska och politiska aspekterna av sådan kunskap efterfrågar dock även mer reflektion över förhållandet mellan forskning och (individuell) handling. 

Det är mycket viktigt att komma ihåg att stora delar av de data som ackumuleras från olika applikationer och gränssnitt i praktiken är uppbyggda för att tjäna särskilda informationsrelaterade intressen (t.ex. mer effektiva sätt att nå specifika målgrupper bland befolkningen). I en dataintensiv forskningskultur kan detta leda till en frestelse att producera frågor utifrån det som de tillgängliga dataresurserna gör möjligt och enkelt att fråga. Detta efterfrågar en motvikt som utgörs av en självständig epistemologisk debatt, där forskningsfrågor inom humaniora och samhällsvetenskaper också formuleras oberoende av datafierade resurser. Det är också skäl att motarbeta risken att komplexa beräkningsmetoder blir ogenomskinliga element inom analysen av stora datasamlingar. Således är det ett ansvar hos forskarsamfundet inom humaniora och samhällsvetenskaper att utveckla och formulera god vetenskapspraxis som hjälper att säkerställa validiteten av komplex beräkningsbaserad analys.

I moderna samhällen är social kvantifiering historiskt sett förknippad med nationell statistik, som en form av offentlig informationsproduktion. Datafieringen innebär en era av en alltmer komplicerad, rik och delvis privatiserad infrastruktur för kvantifiering, där kravet på ett huvudansvar för kunskapsproduktionen också blir mer komplicerat. Utvecklingen av öppen datapraxis kan vara ett sätt att försvara offentlig kunskap under dessa omständigheter. Upprätthållandet av en oberoende kritisk debatt om grundläggande forskningsfrågor inom humaniora och samhällsvetenskaper i eran av datafiering är en annan kärnresurs.

Genom att sammanföra forskning som belyser processen av datafiering och dess inverkningar på forskning inom humaniora och samhällsvetenskaper försöker forskningsinitiativet inom datafiering och forskning inom vetenskapsområdet överlag stödja behovet av undersökningar i området, och att tillåta den att bibehålla sin hela kapacitet och användbarhet i ett dataintensivt samhälle.