Tutkimukseen osallistuminen ja henkilötietojen antaminen on vapaaehtoista ja voit koska tahansa, myös tutkimuksen aikana, keskeyttää osallistumisesi. Päätöksestä olla osallistumatta tai keskeyttää osallistuminen ei koidu sinulle mitään negatiivisia seurauksia.
DTA-projektin keskeisenä ajatuksena on parantaa puhutun suomen kielen automaattista arviointia (ASA) sekä kehittää automaattisen puhumisen arviointia kotoutumiskoulutukseen soveltuvaksi. Projektin tavoitteena on kehittää mobiilisovellus, joka arvioi automaattisesti suomi toisena kielenä (S2) -opiskelijoiden puhuttua suomen kieltä ja antaa palautetta opiskelijalle. Sovellus tarjoaa oppijalle sekä holistisen EVK-taitotasoarvioinnin (Eurooppalaisen viitekehyksen taitotasot) että analyyttisen arvioinnin ja palautetta suullisen kielitaidon keskeisistä osa-alueista: sujuvuus, sanasto, tehtävien suorittaminen, kielellinen laajuus ja sanaston ja kieliopin tarkkuus. Projektissa kerätään osallistujilta puheaineistoa automaattisen puheentunnistuksen (ASR), automaattisen puhumisen arvioinnin (ASA) ja palautteen kehittämiseksi kotoutujille sopivaksi. Automaattinen arviointi voisi tukea opettajien työtä ja mahdollistaa itsenäistä puheen harjoittelua.
Tutkimukseen osallistuvat ovat aikuisia suomenkielen oppijoita, joiden puhesuoritukset äänitetään, ja ihmisarvioijat (kieltenopettajia tai suomen kielen asiantuntijoita), jotka arvioivat puhesuorituksia. Ihmisten antamia arvioita käytetään opettamaan automaattisia arviointimalleja, jotka ennustavat pisteet koneoppimismenetelmillä. Lisäksi kyselyillä ja haastatteluilla kerätään osallistujien taustatietoja ja näkemyksiä esimerkiksi automaattisesta arvioinnista, puhetehtävien toimivuudesta tai arviointiasteikosta. Kyselyillä ja haastatteluilla kerättyjä tietoja käytetään esimerkiksi puhetehtävien mielekkyyden tutkimiseen. Osallistujille kerrotaan tarkemmin käytetyistä menetelmistä ennen aineistonkeruuta.
DTA-projektissa työskentelee tutkijoita Helsingin yliopistosta, Aalto yliopistosta ja Jyväskylän yliopistosta. Helsingin yliopisto vastaa sovelluksen pedagogisesta sisällöstä sekä yhteistyöstä koulujen ja opiskelijoiden kanssa. Aalto-yliopisto vastaa puheen tunnistuksen ja automaattisen palautteen kehittämisestä. Lisäksi Aalto yliopisto vastaa tutkimusaineiston säilyttämisestä. Jyväskylän yliopisto vastaa puhenäytteiden analysoimisesta ja arvioijien rekrytoinnista ja kouluttamisesta sekä arvioijien koulutusmateriaalien luomisesta. Kaikki kumppaniyliopistot osallistuvat uuden aineiston keräämiseen kotoutumiskoulutukseen osallistuvilta suomenkielen oppijoilta.
Tiedonkeruun lisäksi kumppaniyliopistot suunnittelevat Opetushallituksen tuella kotoutumiskoulutukseen osallistuville sopivia automaattisen palautteen muotoja.
Helsingin yliopisto, PL 3 (Fabianinkatu 33), 00014 Helsingin yliopisto
Jyväskylän yliopisto, Seminaarinkatu 15, PL 35, 40014 Jyväskylän yliopisto
Aalto-yliopisto, PL 11000 (Otakaari 1B), 00076 AALTO
Yhteyshenkilö tutkimusta koskevissa asioissa:
Nimi: Raili Hilden
Tiedekunta/osasto/yksikkö: Helsingin yliopisto / Kasvatustieteellinen tiedekunta
Osoite: PL 9 (Siltavuorenpenger 3A), 000014 Helsingin yliopisto
Puhelinnumero: +358504482514
Sähköpostiosoite: raili.hilden@helsinki.fi
Vastuullinen tutkija:
Nimi: Raili Hilden
Sähköpostiosoite: raili.hilden@helsinki.fi
Nimi: Mikko Kurimo
Sähköpostiosoite: mikko.kurimo@aalto.fi
Nimi: Mikko Kuronen
Sähköpostiosoite: mikko.j.kuronen@jyu.fi
Helsingin yliopiston tietosuojavastaavaan saa yhteyden sähköpostiosoitteesta tietosuoja@helsinki.fi, Jyväskylän yliopiston tietosuojavastaava tietosuoja@jyu.fi ja Aalto-yliopiston tietosuojavastaava tietosuojavastaava@aalto.fi
1. Suomi toisena kielenä -oppijoilta kerättävä aineisto:
2. Ihmisarvioijilta (kieltenopettajilta tai asiantuntijoilta) kerättävä aineisto:
Lisäksi keräämme yliopistojen suomen kielen opettajien nimiä ja sähköpostiosoitteita, jotta voimme ottaa yhteyttä suomenoppijoihin. Tutkimukseen osallistuminen ei kuitenkaan vaikuta muihin kieliarviointeihin.
Lisäksi hankkeessa voidaan käyttää uudelleen aiemmin kerättyjä tietoja, esimerkiksi DigiTala-hankkeessa (Svenska Folkskolans vänner 2015–2017) ja (Suomen Akatemia 2019–2023) kerättyjä puheaineistoja ja ihmisarvioita.
Projektissa luodaan suomen kielen suullista kielitaitoa mittaavia puhetehtäviä. Opetushallituksen ja kotoutumiskoulutuksen opettajien avulla pyydämme kieltenopiskelijoita osallistumaan puhetestiin, joka koostuu monologisista puhetehtävistä. Opiskelijat nauhoittavat puhesuoritukset käyttäen omia tai kouluttajan laitteita.
Lisäksi opiskelijat vastaavat kyselyyn, jonka avulla kartoitetaan heidän taustatietojaan, heidän mielipiteitään suorittamastaan kokeesta sekä itsearviointia omasta kielitaidostaan. Joitakin opiskelijoita myös haastatellaan, jotta saadaan palautetta ja kehitysehdotuksia hankkeen kehittämään arviointityökaluun liittyen.
Aineistoa kerätään myös ihmisarvioijilta, jotka kuuntelevat ja arvioivat oppijoiden puhesuorituksia verkkoympäristössä (esimerkiksi Moodlessa). Arvioijat vastaavat taustatietokyselyyn ja osallistuvat hankkeen järjestämään koulutukseen. Osaa heistä myös haastatellaan tai pyydetään vastaamaan kyselyyn palautteen ja kehitysehdotuksien keräämiseksi.
Käytännön syistä osa aineistonkeruusta voi tapahtua etänä käyttäen videoneuvottelutyökalua (esim. Zoom) ja yliopistojen ylläpitämiä verkkoympäristöjä (Moodle).
Lisäksi hanke käyttää aiemmin kerättyjä aineistoja Kielipankista.
Tutkimuksessa ei käsitellä arkaluonteisia henkilötietoja. Puhetehtävät sekä kysely- ja haastattelukysymykset on suunniteltu siten, että niissä ei ilmenisi arkaluonteisia henkilötietoja (kuten etninen alkuperä, poliittiset mielipiteet tai terveyteen liittyvät kysymykset). Osallistujan kielitaitoa koskevilla kysymyksillä ei myöskään ole tarkoitus kerätä tietoa osallistujan etnisestä taustasta. Jos osallistuja paljastaa arkaluonteisia tietoja suullisissa tai kirjallisissa vastauksissaan, arkaluonteiset tiedot poistetaan tutkimusaineistosta.
Henkilötietoja käsitellään seuraavalla yleisen tietosuoja-asetuksen 6 artiklan 1 kohdan mukaisella perusteella: yleistä etua koskeva tehtävä: tieteellinen tai historiallinen tutkimus tai tilastointi (tietosuojalaki 4.3 §)
Jos henkilötietojen käsittely perustuu tutkittavan suostumukseen, tutkittavalla on koska tahansa oikeus peruuttaa suostumuksensa. Suostumuksen peruminen ei vaikuta ennen peruuttamista suoritetun käsittelyn lainmukaisuuteen.
Tietosuojailmoituksen laatimishetkellä tiedossa olevat vastaanottajat:
Tietoja ei siirretä Euroopan talousalueen ulkopuolelle, niitä käsitellään ainoastaan EU:n alueella.
Tutkimusaineistoon sisältyviä henkilötietoja käsitellään ja säilytetään suojattuna niin, että ainoastaan niitä tarvitsevat henkilöt pääsevät tarkastelemaan tietoja. Osallistujien henkilötiedoista muodostuva rekisteri säilytetään erillään kerätyistä puhenäytteistä ja arvioinneista (eri järjestelmissä).
Oppijoiden puhesuorituksiin viitataan nimien sijasta tutkimustunnisteilla. Osallistujia kehotetaan välttämään oikeiden nimien, paikkakuntien ja arkaluonteisten tietojen, kuten poliittisten mielipiteiden, antamista (ks. edellä kohta 7).
Tietojärjestelmissä käsiteltävät tiedot suojataan seuraavilla tavoilla:
Manuaalista (esimerkiksi paperimuodossa tai muuten aineellisessa muodossa) olevaa aineistoa suojataan seuraavilla tavoilla: Lukitussa kaapissa, johon pääsy on ainoastaan Helsingin yliopiston ja Jyväskylän yliopiston vastuullisilla tutkijoilla (Raili Hildén & Mikko Kuronen).
Suorien tunnistetietojesi käsittely: Suorat tunnistetiedot poistetaan analysointivaiheessa ja säilytetään erillään analysoitavasta tutkimusaineistosta.
Tutkimuksen aikana:
Henkilötietoja sisältävän tutkimusaineiston säilyttäminen on tärkeää hyvän tieteellisen käytännön takia. Tieteellisessä tutkimuksessa tutkimusaineisto pyritään säilyttämään, jotta tutkimustulokset voidaan jälkikäteen osoittaa oikeiksi ja aiemmin kerättyä aineistoa voidaan hyödyntää myöhemmissä samaa aihetta käsitelevissä tutkimuksissa tai muiden alojen tieteellisissä tutkimuksissa. Tutkimusaineistoon sisältyviä henkilötietoja käsitellään ja säilytetään suojattuna niin, että ainoastaan niitä tarvitsevat henkilöt pääsevät tarkastelemaan tietoja. Osallistujien henkilötiedoista muodostuva rekisteri säilytetään erillään kerätyistä puhenäytteistä ja arvioinneista (eri järjestelmissä).
Hankkeessa kerättyjä henkilötietoja käsitellään viiden vuoden ajan hankkeen päättymisen jälkeen (2031) tutkimukseen liittyvien julkaisujen valmistumiseksi.
Tutkimuksen päättymisen jälkeen:
Tutkimusaineisto säilytetään myöhempää, yhteensopivaa tieteellistä tutkimusta varten tietosuoja-asetuksen vaatimusten mukaisesti: tunnistetiedoin (ei nimiä tai yhteystietoja, mutta ääni)
Missä aineistoa säilytetään tutkimuksen jälkeen ja kuinka kauan: Kielipankki tai muu vastaava, luotettava ja kuratoitu tietoarkisto, pysyvästi.
Tutkimusaineisto poistetaan yliopistojen käyttämiltä tallennusvälineiltä viiden vuoden kuluttua hankkeen päättymisestä (2031).
Tutkimusaineiston säilytys perustuu tietosuoja-asetuksen 5 artiklan 1 kohdan b ja e alakohtiin. Tutkimusaineiston uudesta tutkimuskäytöstä lähetetään tutkittaville uusi tietosuojailmoitus, paitsi jos rekisterinpitäjä ei enää pysty tunnistamaan rekisteröityjä tutkimusaineistosta.
Uudesta tutkimuksesta ei voida lähettää ilmoitusta tutkittaville myöskään silloin, jos tietojen toimittaminen olisi mahdotonta tai kohtuuttoman vaivalloista tai jos se estäisi tai vaikeuttaisi suuresti tutkimustarkoitusten saavuttamista (tietosuoja-asetuksen 14 artiklan 5 kohdan b alakohta).
Aineisto tallennetaan Kielipankkiin, niiden tutkittavien osalta, jotka ovat antaneet tähän luvan, korkeimman suojaustason aineistoksi (RESTRICTED). Restricted-aineistoon myönnetään oikeus henkilökohtaiseen tutkimuskäyttöön vain hakemuksen perusteella. Ennen uutta tutkimuskäyttöä Kielipankki varmistaa, että uusi tutkimustarkoitus on yhteensopiva aineiston alkuperäisen käytön kanssa asetuksen vaatimusten mukaisesti. Kielipankki antaa aineistolle pysyvät tunnisteet.
Tutkimuksessa ei tehdä automaattisia päätöksiä, joilla on merkittävä vaikutus tutkittaviin.
Alla mainittujen oikeuksien käyttämiseksi ota yhteyttä tämän tietosuojailmoituksen kohdassa 3 nimettyyn tutkimuksen yhteyshenkilöön ja kerro, mitä oikeuksiasi haluat käyttää.
Sinun oikeutesi rekisteröitynä
Pyrimme toteuttamaan oikeutesi aina, kun se on mahdollista. Oikeuksiesi soveltuvuuteen vaikuttaa esimerkiksi se, millä oikeusperusteella henkilötietojasi käsitellään. Oikeuksien soveltumista arvioimme aina tapauskohtaisesti. Tutkimuksen yhteyshenkilö auttaa sinua oikeuksiesi toteuttamisessa ja kertoo niiden soveltuvuudesta.
Tietosuoja-asetuksen mukaisia oikeuksiasi ovat:
Jostain oikeudesta saatetaan tieteellisen tutkimuksen yhteydessä joutua poikkeamaan esimerkiksi silloin, jos oikeutesi toteuttaminen vaarantaisi koko tutkimuksen. Usein voi olla esimerkiksi niin, ettei kaikkia jo kerättyjä ja tutkimukseen sisällytettyjä tietojasi ole mahdollista poistaa jälkikäteen, mutta tämä ei vaikuta oikeuteesi keskeyttää tutkimukseen osallistuminen.
Lisätietoa oikeuksistasi eri tilanteissa löydät Tietosuojavaltuutetun toimiston verkkosivuilta: https://tietosuoja.fi/rekisteroidyn-oikeudet-eri-tilanteissa
Valitusoikeus
Jos koet, että henkilötietojasi on käsitelty epäasianmukaisesti, voit aina ottaa yhteyttä rekisterinpitäjän tietosuojavastaavaan, jonka yhteystiedot löydät tämän tietosuojailmoituksen kohdasta 4.
Sinulla on myös oikeus tehdä valitus valvovalle viranomaiselle, eli Tietosuojavaltuutetun toimistoon, mikäli katsot, että henkilötietojesi käsittelyssä on rikottu voimassa olevaa tietosuojalainsäädäntöä.
Tietosuojavaltuutetun toimiston yhteystiedot:
Tietosuojavaltuutetun toimisto
https://tietosuoja.fi/ilmoitus-tietosuojavaltuutetulle
Käyntiosoite: Lintulahdenkuja 4, 00530 Helsinki
Postiosoite: PL 800, 00531 Helsinki
Vaihde: 029 56 66700
Sähköposti: tietosuoja(at)om.fi
28.2.2025