Helsingin yliopisto antoi tunnustuksen tutkimusaineistojen avaamisen ja uudelleenkäytettävyyden edistäjille

Vuoden 2021 avoimen tieteen palkinnon jakavat Kielipankki sekä tutkimuskoordinaattori Kati Lassila-Perini.

Helsingin yliopiston avoimen tieteen palkinto jaetaan vuosittain tunnustukseksi merkittävästä avoimen tieteen edistämisestä. Vuoden 2021 palkinnon teemana on tutkimusaineistojen saavutettavuus ja käytettävyys. Palkinnon tavoitteena on nostaa esiin tutkimusaineistojen uudelleen käytettävyyden ja avoimen saatavuuden merkitys tieteelle ja tiedeyhteisölle.

Palkintoehdotuksia pyydettiin yliopiston yksiköiltä sekä Flamman kautta kaikilta yliopistolaisilta. Palkinnonsaajaksi pyydettiin ehdottamaan tutkimusprojektia tai tutkimusinfrastruktuuria, joka on edistänyt merkittävästi tutkimusaineistojen saavutettavuutta ja käytettävyyttä omalla alallaan. Saapuneet ehdotukset arvioi raati, johon kuuluivat vararehtori Paula Eerola, ylikirjastonhoitaja Kimmo Tuominen, tietotekniikkapäällikkö Minna Harjuniemi, Luonnontieteellisen keskusmuseon johtaja Aino Juslén, sekä tutkimuspalveluiden asiantuntijat Tiina Käkelä ja Marko Peura.

Palkintoraati päätti jakaa tunnustuksen kahdelle ehdokkaalle, joita yhdistää pitkäjänteinen ruohonjuuritason työ arvokkaiden tutkimusaineistojen käytön edistämiseksi. Palkinnon saivat Kielipankki ja sen Lahjoita puhetta -aineisto sekä tutkimuskoordinaattori Kati Lassila-Perinin työ kokeellisen hiukkasfysiikan aineistojen hyödyntämisessä tutkimuksessa ja opetuksessa.

Palkinto jaettiin 29.10. Tiedekulmassa pidetyssä avoimen tieteen iltapäivässä, jonka teemana oli ”Open Data Matters”. Tapahtuma sijoittuu kansainväliselle Open Access -viikolle 25.–31.10.2021.

 

Kieliaineistot kaikkien käyttöön

Vuonna 1995 perustettu Kielipankki on tänä päivänä kieliaineistoja käyttävien tutkijoiden monipuolinen palvelukokonaisuus.  Se tarjoaa laajan valikoiman teksti- ja puheaineistoja, sekä työkaluja ja koulutusta aineistojen käsittelyyn, analyysiin ja hallintaan. Osa aineistoista on avoimesti kenen tahansa käytettävissä, osa edellyttää kirjautumista yliopistojen tunnuksilla, ja osa erillisten käyttöoikeuksien hakemista.

Kieliaineistoja kerätään suomalaisten yliopistojen ja tutkimusorganisaatioiden muodostaman FIN-CLARIN-konsortion voimin. Kielipankin toimintaa koordinoi Helsingin yliopisto, ja tekniset palvelut tuottaa Tieteen tietotekniikan keskus CSC. FIN-CLARIN on osa kansainvälistä CLARIN ERIC -tutkimusinfrastruktuuria, jonka aineistot ovat myös Kielipankin kautta tutkijoiden käytössä.

Kielipankin hankkeista on viime aikoina ollut näkyvästi esillä vuonna 2020 käynnistynyt Lahjoita puhetta -kampanja, joka on toteutettu yhteistyössä Ylen, Ilmastorahaston ja Solita Oy:n kanssa. Toteutetun kampanjan aikana on kerätty noin 4000 tuntia arkipuhetta erilaisilta ihmisiltä koko Suomesta. Lahjoita puhetta -aineistoa voidaan käyttää uudelleen sekä tutkimuskäytössä että yrityskäytössä tietosuoja-asetuksen mukaisesti. Aineistosta 1500 tuntia on litteroitu käsin ja loppuosan litterointi on tekeillä automaattisen puheentunnistuksen avulla. Aineistossa on puhetta erilaisista aiheista, esimerkiksi korona-ajan vaikutuksista suomalaisten arkeen ja työelämään, mikä tekee siitä kiinnostavaa erityisesti ihmistieteiden näkökulmasta. Lahjoita puhetta palkittiin myös eurooppalaisten yleisradioyhtiöiden Prix Europa -palkinnolla digitaalisten audioprojektien sarjassa lokakuussa.

Kielipankki on edistänyt aineistojensa käytettävyyttä myös järjestämällä avoimia menetelmäkursseja verkko-opetuksena. Kurssitarjonta on suunnattu erityisesti humanististen, yhteiskuntatieteellisten ja käyttäytymistieteellisten alojen opiskelijoille ja väitöskirjantekijöille. Kielipankin järjestämä kaksikielinen Puheen analyysin perusteet – Introduction to Speech Analysis sai CLARIN ERIC:in myöntämän avoimien oppimateriaalien palkinnon vuonna 2021.

 

CERN-kokeen dataa tutkimukseen ja opetukseen

Tutkimuskoordinaattori Kati Lassila-Perinin työ kokeellisen hiukkasfysiikan aineistojen avaamiseksi osoittaa, että yhden henkilön sitoutumisella avoimen tieteen edistämisen on globaalia vaikuttavuutta. Lassila-Perini on työskennellyt Euroopan hiukkasfysiikan tutkimuslaitoksessa CERN:issä vuodesta 1990. Vuonna 2011 hän oli mukana laatimassa linjausta CERN:in CMS-kokeessa syntyvän datan avaamisesta, uudelleenkäytöstä ja pitkäaikaissäilytyksestä. Tämä linjaus oli lajissaan ensimmäinen, ja Lassila-Perini koordinoi CERN:issä projektia ”Data Preservation and Open Access”, joka on siirtänyt linjauksen periaatteita käytäntöön. Tämän työn tuloksena suuri osa CMS-kokeen dataa on nykyään vapaasti käytettävissä.

CMS-kokeen avulla tutkitaan erittäin korkeaenergisiä hiukkasten törmäyksiä ja törmäysten jälkeisiä hiukkasten hajoamisen prosesseja. Kokeessa syntyvät aineistot ovat suuria ja monimutkaisia, joten niiden avaaminen on myös vaativa prosessi. Datan käsittely vaatii erillisiä ohjelmistoja. Aineistojen käytön täytyy olla tarpeeksi selkeää ja helppoa, jotta muutkin kuin kokeellisen hiukkasfyysiikan tutkijat voisivat niitä hyödyntää. CMS-datan avaaminen on edistänyt monitieteisyyttä myös Helsingin yliopiston sisällä. Lisäksi pitkäaikaissäilytys mahdollistaa datan käytön pitkälle tulevaisuuteen, mikä edustaa tieteen kestävää kehitystä.

Lassila-Perini johtaa myös Helsingin yliopiston yhteydessä toimivan Fysiikan tutkimuslaitoksen koulutoiminnan ja avoimen datan projektia, jossa CMS-dataa on käytetty suomalaisessa lukio-opetuksessa. Opetushallituksen tuella on toteutettu noin parinkymmenen lukiolaisryhmän vierailu CERN:issä vuosittain. Projekti on myös useana vuonna järjestänyt lukio-opettajille täydennyskoulutusta avoimen datan käytöstä ja kehittänyt työkaluja laajojen avointen aineistojen käsittelyyn opetuksessa.