Tietoa tutkimukseen osallistuvalle

Hankkeessa kehitetään automaattista puheentunnistusta hyödyntäviä sovelluksia kielitaidon arviointiin.

Suomen Akatemia rahoittaa DigiTala-hanketta 2019-2023 ja sen toteuttavat yhteistyössä Helsingin yliopisto, Jyväskylän yliopisto ja Aalto-yliopisto (helsinki.fi/fi/digitala). Tutkimuksesta vastaa Helsingin yliopistossa apulaisprofessori Raili Hildén (yhteistyö koulujen ja sidosryhmien kanssa), Jyväskylän yliopistossa yliopistonlehtori Mikko Kuronen (puhenäytteiden analyysi ja ihmisarvioijien koulutus) ja Aalto-yliopistossa professori Mikko Kurimo (puheen automaattinen tunnistus ja koneellinen arviointi).

Hankkeessa kehitetään automaattista puheentunnistusta hyödyntäviä sovelluksia kielitaidon arviointiin

Tavoitteena on selvittää, miten vieraiden kielten puhumista voidaan arvioida puheentunnistuksen avulla (automatic speech recognition, ASR) esimerkiksi ylioppilastutkinnon kaltaisissa isoissa ja tärkeissä kielikokeissa. Sovellusten avulla opiskelijat voivat myös harjoitella ääntämistä ja puhumista itsenäisesti. Tutkimuksessa keskitytään erityisesti toisen ja vieraan kielen ääntämisen, sanaston, kieliopin ja sujuvuuden arviointiin.

Ensimmäiset versiot suomea tai ruotsia toisena kielenä opiskeleville lukiolaisille

Ensimmäiset versiot sovelluksista suunnitellaan suomalaisille lukiolaisille, jotka opiskelevat ruotsia tai suomea toisena kotimaisena kielenä. Myöhemmin sovelluksia voidaan kehittää myös muiden vieraiden kielten arviointiin. On tärkeää, että tutkimukseen osallistuu mahdollisimman moni opiskelija, sillä kone ei itsestään osaa arvioida opiskelijoiden puhetta, vaan konetta pitää opettaa siihen.

Oppiakseen kone tarvitsee paljon erilaisten opiskelijoiden ääninäytteitä

Ääninäytteet eivät yksinään riitä, vaan niihin tarvitaan opettajilta ja ihmisarvioijilta kommentteja. Opiskelijoiden puhenäytteiden ja ihmisarviointien avulla kone oppii tunnistamaan paremmin mitä kielenoppijat sanovat ja miten ihmiset arvioivat eritasoiset ja erilaiset näytteet.

Tutkimme käyttäjien kokemuksia ja automaattisen arvioinnin reiluutta

Testaamme myös koneen antamaa automaattista palautetta. Meille on tärkeää tietää, ovatko koneen antamat arviot opettajien ja opiskelijoiden mielestä reiluja. Tutkimme myös esimerkiksi, koetaanko koneelta saatu palaute hyödylliseksi ja ymmärrettäväksi. Hankkeen loppupuolella tutkimme lisäksi työkalun käytettävyyttä.

Opiskelijoiden nimet, syntymäajat ja koulut poistetaan tutkimusaineistosta analyysivaiheessa. Tutkittaville laadittu tietosuojailmoitus löytyy DigiTalan nettisivuilta.

Lisätietoa tutkimuksesta antaa: Raili Hildén, +358504482514, raili.hilden@helsinki.fi

Tietoa lukiolaisille

Voimme myös pyytää lupaa käyttää aineistoa seuraaviin tarkoituksiin. Voit päättää mihin näistä tarkoituksista annat luvan:

  • Voimme pyytää lupaa seurantatutkimukseen, jossa myöhemmin vertaamme opiskelijan puhumisen arvosanaa muihin kielitaidon osataitoihin liittyviin tuloksiin (esim. kirjoittaminen, kuunteleminen ja lukeminen) ylioppilaskokeessa. Tämä vertailu antaa meille arvokasta palautetta kehittämämme sovelluksen toimivuudesta sekä osataitojen välisestä yhteydestä.
  • Voimme pyytää lupaa ottaa teihin yhteyttä tutkimuksen myöhemmissä vaiheissa, kun keräämme lisää palautetta ja kehitysehdotuksia opiskelijoilta, opettajilta ja arvioijilta. Haastattelemme myös joitakin käyttäjiä.
  • Voimme pyytää lupaa käyttää kerättäviä puhenäytteitä kielten opettajien ja arvioijien kouluttamisessa. Tämä edellyttää joidenkin äänitteiden julkaisemista esimerkkeinä. Emme kuitenkaan julkaise nimiä, syntymäaikoja tai kouluja äänitteiden yhteydessä.
  • Voimme pyytää lupaa tallettaa aineisto kansalliseen Kielipankkiin. Tässä tutkimuksessa kerättävä aineisto on hyödyllistä muussakin kielen oppimiseen liittyvässä tutkimuksessa. Kielipankkiin tallennettavasta aineistosta poistetaan yksilöivät tunnisteet, kuten nimet, syntymäajat ja koulut. Aineistoa luovutetaan Kielipankista vain perustellusti tutkimuskäyttöön.