Kielipankissa: Juhana Salonen

Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Jyväskylän yliopiston projektitutkija Juhana Salonen kertoo, miten hän on ollut mukana tuottamassa Kielipankin aineistoa "Suomalaisen viittomakielen korpus".

Kuka olet?

Olen Juhana Salonen ja työskentelen projektitutkijana Jyväskylän yliopiston viittomakielen keskuksessa. Vastuullani on Suomen kansallisten viittomakielten (suomalainen ja suomenruotsalainen viittomakieli) korpustyö. Valmistuin filosofian maisteriksi suomalainen viittomakieli pääaineena syksyllä 2012.

Mikä on työsi aihe?

Työstän yhdessä tiimin kanssa molempien viittomakielten korpuksesta infrastruktuuria tutkimusta varten. Olen työskennellyt vuodesta 2014 lähtien korpusprojektissa, jonka aikana on kuvattu yhteensä 103 äidinkieleltään viittomakielistä kielenopasta ympäri Suomea. Toimin opastajana kuvauksissa, joissa pääsin läheltä seuraamaan kielenoppaiden keskusteluja ja kerrontaa yhteensä seitsemän eri kamerakulman taltioimana. Tulokseksi saatiin yli 700 tuntia videomateriaalia. Aineistonkeruun ja editoinnin jälkeen videoaineistoa alettiin annotoida ELAN-ohjelmalla (Eudico Linguistic Annotator). Annotointi toteutettiin siten, että viitotusta tekstivirrasta eroteltiin ilmauksia sekä viittoma- että virketasolla. Viittomat identifioitiin ID-glossien, jotka ovat verkkoyhteydessä Suomen Signbank -leksikkotietokantaan, avulla ja virkkeet käännettiin suomeksi. Olemme pyrkineet siihen, että suuren aineistokokonaisuuden annotointi olisi mahdollisimman systemaattista, jotta aineisto soveltuisi useiden tutkijoiden käyttöön ja sopisi erilaisiin tutkimustavoitteisiin.

Miten Kielipankki liittyy tutkimukseesi?

Korpustyömme ensisijaisina tavoitteina on sekä pitkäaikaissäilyttää aineistoa että julkaista siitä eri osia kielenoppaiden tutkimussuostumusten ja tietosuojalainsäädännön ehtojen mukaisesti. Kielipankki on tarjonnut loistavat puitteet tavoitteidemme toteuttamiseksi, mistä isot kiitokset. Ensimmäinen osakokonaisuus Suomalaisen viittomakielen korpuksesta (Corpus FinSL) siirrettiin Kielipankkiin maaliskuussa 2019. Corpus FinSL sisältää noin 14,5 tuntia videomateriaalia sekä tekstimuotoisia annotaatioita ja metatietoja yhteensä 21 viittojalta. Aineisto on jaettu kahteen osakorpukseen: Suomalaisen viittomakielen korpus: kerronta-aineisto (elisitoidut kertomukset) ja Suomalaisen viittomakielen korpus: keskusteluaineisto (keskustelut), joista ensimmäinen on julkisesti saatavilla ja toinen edellyttää tutkimussuunnitelmaa sekä henkilökohtaista käyttöoikeutta Kielipankin RES-lisenssin mukaisesti. Julkaistua aineistoa on hyödynnetty jo niin suomalaisen viittomakielen tutkimuksessa kuin opetuksessakin tähän mennessä, mikä on vasta alkusoittoa suurelle harppaukselle viittomakielisellä alalla (mm. opetusmateriaalin ja viittomakielen yhteiskunnallisen aseman kehittäminen).

Kielipankin aineistoon liittyviä julkaisuja:

FIN-CLARIN eli suomalaisten yliopistojen, Tieteen tietotekniikan keskuksen ja Kotimaisten kielten keskuksen muodostama konsortio auttaa humanististen tieteiden tutkijoita käyttämään, jalostamaan, säilyttämään ja jakamaan tutkimusaineistoja. Aineistoja ja työkaluja tarjoaa Kielipankki.