Språkbanken dokumenterar språket och kulturen

Med hjälp av korpusarna i Språkbanken kan man ta reda på dialektala former av ett ord eller spåra när ett nyord fick fotfäste i standardspråket.

I Språkbanken kan man utforska bl.a. Aleksis Kivis brev, gamla tidningstexter ur Nationalbibliotekets samlingar, diskussioner på webbforumet Suomi24 eller varför inte republikens presidents nyårstal.

Språkbanken samlar in och tillgängliggör text- och talkorpusar. Tjänsterna riktar sig till forskare från olika vetenskapsområden. Mycket av materialet är också fritt tillgängligt. Språkbanken innehåller även material på andra språk än finska, t.ex. flerspråkiga översättningskorpusar.

Av upphovsrättsliga skäl eller på grund av datasekretess har åtkomsten till vissa av Språkbankens korpusar begränsats. Somliga språkresurser är tillgängliga med användaridentifiering via ens hemorganisation. Till resurser med mer begränsad åtkomst kan man ansöka om användarrättigheter i en webbtjänst.

Språkkorpusarna begränsar sig inte enbart till text och tal. Språkbanken innehåller också material på teckenspråk.

– Materialet på teckenspråk ökar, berättar projektplanerare Mietta Lennes.

I samarbete med Finlands Dövas Förbund har Språkbanken utökats med Språkpolitiska programmet för teckenspråken i Finland, på teckenspråk naturligtvis.

Litteratur och diskussionsforum

Genom att söka i materialet från diskussionsforumet Suomi24 kan forskaren t.ex. undersöka hur ord med skönlitterärt ursprung spridits till och används i standardspråket. Hurdana uttryck kan man söka efter? Mietta Lennes ger exempel på vad och hur man kan söka.

– Ordet jästi (mugglare) som är bekant från böckerna om Harry Potter av J. K. Rowling får många träffar på forumets avdelning för kultur och underhållning, men också på avdelningarna för husdjur och relationer.

De flesta av Språkbankens korpusar har organiserats grammatikaliskt, och därför tar en sökning på ordet jästi med konkordansverktyget Korp fram ordets alla former.

En sökning med Korp visar också att frasen ”Kyllä minä niin mieleni pahoitin” (ungefär ”Jag tog nog så illa upp”) – en fras som ofta uttalas av Kverulanten (Mielensäpahoittaja), den grinige gamle gubben i Tuomas Kyrös romaner med samma namn – blev allt mer frekvent på forumet ungefär vid samma tid som den första filmen om Kverulanten släpptes.

I korpusen ”Suomen kielen näytteitä” hittar den dialektintresserade forskaren olika variationer på talad finska: t.ex. ordet metsä uttalas i de östra delarna av landet ofta mehtä medan man i väst säger mettä eller messä.

Språk och kultur dokumenteras i samarbete

Språkbanken drivs av konsortiet FIN-CLARIN. Konsortiet består av finländska universitet och forskningsorganisationer, och det fungerar som Språkbankens stödnätverk. Inom konsortiet sköts materialförvärv, verktyg och utbildning av Helsingfors universitet. Teknisk administratör är konsortiemedlemmen CSC – IT-centret för vetenskap.

– FIN-CLARINs mål är att säkra korpusarnas fortbestånd och tillgänglighet. Samtidigt får forskarna välförtjänt erkänsla för det arbete de utfört med att sammanställa och tillgängliggöra språkkorpusarna, berättar Mietta Lennes.

Alla forskare och forskningsgrupper i Finland kan erbjuda sitt språkmaterial att ställas till förfogande av FIN-CLARIN.

”FIN-CLARIN har också en kulturhistorisk betydelse som bevarare av språket och kulturen.”

– Språkbanken erbjuder forskare olika slags verktyg för hantering och undersökning av korpusarna, t.ex. sökfunktioner, automatisk analys med mera. FIN-CLARIN har också en kulturhistorisk betydelse som bevarare av språket och kulturen.

FIN-CLARIN hör till den internationella forskningsinfrastrukturen CLARIN ERIC i vilken 18 länder medverkar. Språkbanken ordnade ett 20-årsjubileumsseminarium den 9–10 juni.