Finländska Twitteranvändares språkval och geografiska läge har undersökts utgående från 30 000 användare och 38 miljoner meddelanden

En multidisciplinär forskningsgrupp vid Helsingfors universitet har undersökt finländska Twitteranvändares språkval samt fördelningen av språk och användare över hela Finland.

Inför undersökningen samlades 38 miljoner Twittermeddelanden in från 30 000 användare. Av meddelandena innehöll 2 miljoner geografisk information. Dessutom undersökte forskarna förändringen i språklandskapets mångfald över tid och rum. I undersökningen fastställdes även användarnas hemort på kommun- och landskapsnivå utgående från deras platshistorik. Användarnas språk identifierades med hjälp av automatisk språkigenkänning. 

Finska och engelska dominerar 

– Som man säkert kan gissa är det finska och engelska som dominerar på Twitter i Finland, säger biträdande professor Tuomo Hiippala.

– På landsbygden används mer finska och mindre engelska än bland genomsnittet. I övrigt fördelar sig finska och engelska någorlunda jämnt. 

Enligt Hiippala innehåller Twittermeddelanden emellertid mer sällan platsinformation än till exempel inlägg på Instagram gör. Forskarnas observationer motsvarar i hög grad de språkliga realiteterna i Finland, vilket signalerar att algoritmerna för igenkänning av hemort och språk är rätt tillförlitliga. 

– Det är emellertid viktigt att hålla i åtanke att Twitteranvändarna inte representerar hela befolkningen, påminner Hiippala. – Det naturliga steget härnäst är att undersöka användningen av enskilda språk och deras interna variation. Exempelvis skulle förekomsten av finska dialekter på Twitter vara ett intressant forskningsområde. 

Enligt doktoranden Tuomas Väisänen betonas den historiska och geografiska dimensionen i den regionala fördelningen av språken: svenska används i genomsnitt mer i de svenskspråkiga regionerna längs kusten, medan ryska förekommer mer i närheten av gränsen österut. När det gäller estniska är observationerna koncentrerade till södra Finland. 

– Ur en tidsmässig och geografisk synpunkt åskådliggör det digitala språklandskapet på Twitter hur den digitala och den fysiska världen är sammanflätade över hela Finland, oberoende av plats, konstaterar Väisänen. 

Språkforskningen kan vara till nytta ur geografisk synpunkt

Majoriteten av de finländska Twitteranvändarna använder ändå fler än ett språk på plattformen, men relativt sett fördelar sig inte språkinslagen jämnt. Endast 18 procent av användarna använder bara ett språk. 

– Undersökningen signalerar att språkforskningen kan dra nytta av ett geografiskt perspektiv, säger akademiforskare Olle Järv.

– En tidsmässig undersökning kompletterar å sin sida denna geografiska bild genom att påvisa hur den språkliga mångfalden varierar efter dags-, vecko- och årsrytmer. Twittermeddelanden och andra källor till stordata öppnar upp nya möjligheter för språkforskningen. 

Användare som tenderar att hålla sig till ett språk kan oftare än genomsnittet lokaliseras till landsbygden medan de som aktivt använder flera språk finns längs kusten och i huvudstadsregionen. Rikast är språklandskapet längs kustens svenskspråkiga regioner och i Nyland. Å andra sidan förekom det 19 språk också i det språkligt sett fattigaste området, norra Karelen. 

Undersökningen genomfördes inom ramen för ett projekt för kartläggning av språklandskapet i huvudstadsregionen. Ansvarig forskare för projektet är Tuomo Hiippala vid Humanistiska fakulteten vid Helsingfors universitet. Projektet finansieras av Emil Aaltosen Säätiö. 

De övriga skribenterna bakom forskningsartikeln är Tuomas Väisänen, Tuuli Toivonen och Olle Järv vid Matematisk-naturvetenskapliga fakulteten.  Forskningsartikeln på engelska  Mapping the languages of Twitter in Finland: richness and diversity in space and time

Mer information:  
biträdande professor Tuomo Hiippala, 050 377 3366, tuomo.hiippala@helsinki.fi, @tuomo_h