Tietosuojaseloste

Tietoa henkilötietojen käsittelystä tutkimushankkeessa DigiTala toiminnaksi - Automaattinen puhumisen arviointi kotoutumista edistämässä

Tutkimukseen osallistuminen ja henkilötietojen antaminen on vapaaehtoista ja voit koska tahansa, myös tutkimuksen aikana, keskeyttää osallistumisesi. Päätöksestä olla osallistumatta tai keskeyttää osallistuminen ei koidu sinulle mitään negatiivisia seurauksia.

1. Kuvaus tutkimushankkeesta ja miksi henkilötietojasi tarvitaan

DTA-projektin keskeisenä ajatuksena on parantaa puhutun suomen kielen automaattista arviointia (ASA) sekä kehittää automaattisen puhumisen arviointia kotoutumiskoulutukseen soveltuvaksi. Projektin tavoitteena on kehittää mobiilisovellus, joka arvioi automaattisesti suomi toisena kielenä (S2) -opiskelijoiden puhuttua suomen kieltä ja antaa palautetta opiskelijalle. Sovellus tarjoaa oppijalle sekä holistisen EVK-taitotasoarvioinnin (Eurooppalaisen viitekehyksen taitotasot) että analyyttisen arvioinnin ja palautetta suullisen kielitaidon keskeisistä osa-alueista: sujuvuus, sanasto, tehtävien suorittaminen, kielellinen laajuus ja sanaston ja kieliopin tarkkuus. Projektissa kerätään osallistujilta puheaineistoa automaattisen puheentunnistuksen (ASR), automaattisen puhumisen arvioinnin (ASA) ja palautteen kehittämiseksi kotoutujille sopivaksi. Automaattinen arviointi voisi tukea opettajien työtä ja mahdollistaa itsenäistä puheen harjoittelua.

Tutkimukseen osallistuvat ovat aikuisia suomenkielen oppijoita, joiden puhesuoritukset äänitetään, ja ihmisarvioijat (kieltenopettajia tai suomen kielen asiantuntijoita), jotka arvioivat puhesuorituksia. Ihmisten antamia arvioita käytetään opettamaan automaattisia arviointimalleja, jotka ennustavat pisteet koneoppimismenetelmillä. Lisäksi kyselyillä ja haastatteluilla kerätään osallistujien taustatietoja ja näkemyksiä esimerkiksi automaattisesta arvioinnista, puhetehtävien toimivuudesta tai arviointiasteikosta. Kyselyillä ja haastatteluilla kerättyjä tietoja käytetään esimerkiksi puhetehtävien mielekkyyden tutkimiseen. Osallistujille kerrotaan tarkemmin käytetyistä menetelmistä ennen aineistonkeruuta.

DTA-projektissa työskentelee tutkijoita Helsingin yliopistosta, Aalto yliopistosta ja Jyväskylän yliopistosta. Helsingin yliopisto vastaa sovelluksen pedagogisesta sisällöstä sekä yhteistyöstä koulujen ja opiskelijoiden kanssa. Aalto-yliopisto vastaa puheen tunnistuksen ja automaattisen palautteen kehittämisestä. Lisäksi Aalto yliopisto vastaa tutkimusaineiston säilyttämisestä. Jyväskylän yliopisto vastaa puhenäytteiden analysoimisesta ja arvioijien rekrytoinnista ja  kouluttamisesta sekä arvioijien koulutusmateriaalien luomisesta. Kaikki kumppaniyliopistot osallistuvat uuden aineiston keräämiseen kotoutumiskoulutukseen osallistuvilta suomenkielen oppijoilta.

Tiedonkeruun lisäksi kumppaniyliopistot suunnittelevat Opetushallituksen tuella kotoutumiskoulutukseen osallistuville sopivia automaattisen palautteen muotoja.

2. Tutkimuksen rekisterinpitäjä

Helsingin yliopisto, PL 3 (Fabianinkatu 33), 00014 Helsingin yliopisto

Jyväskylän yliopisto, Seminaarinkatu 15, PL 35, 40014 Jyväskylän yliopisto

Aalto-yliopisto, PL 11000 (Otakaari 1B), 00076 AALTO

3. Contact person and principal investigator 

Yhteyshenkilö tutkimusta koskevissa asioissa:

Nimi: Raili Hilden
Tiedekunta/osasto/yksikkö: Helsingin yliopisto / Kasvatustieteellinen tiedekunta
Osoite: PL 9 (Siltavuorenpenger 3A), 000014 Helsingin yliopisto
Puhelinnumero: +358504482514
Sähköpostiosoite: raili.hilden@helsinki.fi

Vastuullinen tutkija:

Nimi: Raili Hilden
Sähköpostiosoite: raili.hilden@helsinki.fi

Nimi: Mikko Kurimo
Sähköpostiosoite: mikko.kurimo@aalto.fi

Nimi: Mikko Kuronen
Sähköpostiosoite: mikko.j.kuronen@jyu.fi

4. Tietosuojavastaavan yhteystiedot

Helsingin yliopiston tietosuojavastaavaan saa yhteyden sähköpostiosoitteesta tietosuoja@helsinki.fi, Jyväskylän yliopiston tietosuojavastaava tietosuoja@jyu.fi ja Aalto-yliopiston tietosuojavastaava tietosuojavastaava@aalto.fi

5. Mitä henkilötietoja tutkimusaineisto sisältää

   1. Suomi toisena kielenä -oppijoilta kerättävä aineisto: 

  • Oppijoiden nimet, suostumukset 
  • Oppijoiden äänitteet (puhe) 
  • Oppijoiden koesuoritukset (vastaukset, arvosanat) 
  • Oppijoiden taustatiedot (esimerkiksi montako kurssia opiskeltuna, mahdollisesti kysymyksiä kielitaustasta, kielen oppimisesta, suullisesta kielitaidosta, sukupuolesta, äidinkielestä)
  • Oppijoiden itsearviot kielitaidostaan / koesuorituksesta
  • Oppijoiden mielipiteet esimerkiksi puhetehtävistä tai automaattisesta palautteesta (kysely, haastattelu)
  • Oppijoiden suoritusten arviointi (automaattinen arviointi)

   2. Ihmisarvioijilta (kieltenopettajilta tai asiantuntijoilta) kerättävä aineisto:

  • Arvioijien nimet ja yhteystiedot, suostumukset
  • Arvioijien taustatiedot (esimerkiksi ikä, kokemus, äidinkieli, kielitaito)
  • Arvioijien arvio oppijoiden suorituksesta (holistinen taso + analyyttiset kriteerit)
  • Arvioijilta saatu palaute kehitettävästä työkalusta (kysely, haastattelu)

Lisäksi keräämme yliopistojen suomen kielen opettajien nimiä ja sähköpostiosoitteita, jotta voimme ottaa yhteyttä suomenoppijoihin. Tutkimukseen osallistuminen ei kuitenkaan vaikuta muihin kieliarviointeihin.

Lisäksi hankkeessa voidaan käyttää uudelleen aiemmin kerättyjä tietoja, esimerkiksi DigiTala-hankkeessa (Svenska Folkskolans vänner 2015–2017) ja (Suomen Akatemia 2019–2023) kerättyjä puheaineistoja ja ihmisarvioita.

6. Mistä lähteistä henkilötietojasi kerätään

Projektissa luodaan suomen kielen suullista kielitaitoa mittaavia puhetehtäviä. Opetushallituksen ja kotoutumiskoulutuksen opettajien avulla pyydämme kieltenopiskelijoita osallistumaan puhetestiin, joka koostuu monologisista puhetehtävistä. Opiskelijat nauhoittavat puhesuoritukset käyttäen omia tai kouluttajan laitteita.

Lisäksi opiskelijat vastaavat kyselyyn, jonka avulla kartoitetaan heidän taustatietojaan, heidän mielipiteitään suorittamastaan kokeesta sekä itsearviointia omasta kielitaidostaan. Joitakin opiskelijoita myös haastatellaan, jotta saadaan palautetta ja kehitysehdotuksia hankkeen kehittämään arviointityökaluun liittyen.

Aineistoa kerätään myös ihmisarvioijilta, jotka kuuntelevat ja arvioivat oppijoiden puhesuorituksia verkkoympäristössä (esimerkiksi Moodlessa). Arvioijat vastaavat taustatietokyselyyn ja osallistuvat hankkeen järjestämään koulutukseen. Osaa heistä myös haastatellaan tai pyydetään vastaamaan kyselyyn palautteen ja kehitysehdotuksien keräämiseksi.

Käytännön syistä osa aineistonkeruusta voi tapahtua etänä käyttäen videoneuvottelutyökalua (esim. Zoom) ja yliopistojen ylläpitämiä verkkoympäristöjä (Moodle).

Lisäksi hanke käyttää aiemmin kerättyjä aineistoja Kielipankista. 

7. Arkaluonteiset henkilötiedot (ja erityiset henkilötietoryhmät) 

Tutkimuksessa ei käsitellä arkaluonteisia henkilötietoja. Puhetehtävät sekä kysely- ja haastattelukysymykset on suunniteltu siten, että niissä ei ilmenisi arkaluonteisia henkilötietoja (kuten etninen alkuperä, poliittiset mielipiteet tai terveyteen liittyvät kysymykset). Osallistujan kielitaitoa koskevilla kysymyksillä ei myöskään ole tarkoitus kerätä tietoa osallistujan etnisestä taustasta. Jos osallistuja paljastaa arkaluonteisia tietoja suullisissa tai kirjallisissa vastauksissaan, arkaluonteiset tiedot poistetaan tutkimusaineistosta.

8. Henkilötietojen käsittelyn oikeusperuste

Henkilötietoja käsitellään seuraavalla yleisen tietosuoja-asetuksen 6 artiklan 1 kohdan mukaisella perusteella: yleistä etua koskeva tehtävä: tieteellinen tai historiallinen tutkimus tai tilastointi (tietosuojalaki 4.3 §)

Jos henkilötietojen käsittely perustuu tutkittavan suostumukseen, tutkittavalla on koska tahansa oikeus peruuttaa suostumuksensa. Suostumuksen peruminen ei vaikuta ennen peruuttamista suoritetun käsittelyn lainmukaisuuteen.

9. Tietojen vastaanottajat 

Tietosuojailmoituksen laatimishetkellä tiedossa olevat vastaanottajat:

  • Projektitutkijat (kaikki aineisto)
  • Aineiston keruuseen liittyvät palveluntarjoajat: Yliopistojen Zoom-videoneuvottelutyökalu (etäyhteydet, haastattelut, palautekeskustelut, koulutukset). Aalto-yliopiston tarjoama Webropol-kyselytyökalu (suostumus- ja taustatietokysely).
  • Opettajien täydennyskoulutus (näytteet, joita käytetään havainnollistamistarkoituksiin oppijoiden suostumuksella)
  • Projektin rekrytoimat ihmisarvioijat (puhesuoritusten arviointi)
  • Projektin rekrytoimat litteroijat (puhesuoritukset, haastattelut)
  • Projektin päätyttyä aineisto arkistoidaan Kielipankkiin (tai muu vastaava, luotettava ja kuratoitu tietoarkisto) niiden tutkittavien osalta, jotka ovat antaneet tähän luvan (nimiä ja yhteystietoja ei tallenneta Kielipankkiin)
  • Hankkeen yhteistyökumppanit pääsevät aineistoon käsiksi kumppaniyliopistojen kautta (henkilötietoja siirtämättä) 

10. Tietojen siirto Euroopan talousalueen ulkopuolelle 

Tietoja ei siirretä Euroopan talousalueen ulkopuolelle, niitä käsitellään ainoastaan EU:n alueella.

11. Henkilötietojen suojaus

Tutkimusaineistoon sisältyviä henkilötietoja käsitellään ja säilytetään suojattuna niin, että ainoastaan niitä tarvitsevat henkilöt pääsevät tarkastelemaan tietoja. Osallistujien henkilötiedoista muodostuva rekisteri säilytetään erillään kerätyistä puhenäytteistä ja arvioinneista (eri järjestelmissä).

Oppijoiden puhesuorituksiin viitataan nimien sijasta tutkimustunnisteilla. Osallistujia kehotetaan välttämään oikeiden nimien, paikkakuntien ja arkaluonteisten tietojen, kuten poliittisten mielipiteiden, antamista (ks. edellä kohta 7).

Tietojärjestelmissä käsiteltävät tiedot suojataan seuraavilla tavoilla:

  • käyttäjätunnus ja salasana
  • käytön rekisteröinti
  • lokitus
  • kulunvalvonta
  • tietojen salaus/kryptaus
  • kaksivaiheinen tunnistautuminen

Manuaalista (esimerkiksi paperimuodossa tai muuten aineellisessa muodossa) olevaa aineistoa suojataan seuraavilla tavoilla: Lukitussa kaapissa, johon pääsy on ainoastaan Helsingin yliopiston ja Jyväskylän yliopiston vastuullisilla tutkijoilla (Raili Hildén & Mikko Kuronen).

Suorien tunnistetietojesi käsittely: Suorat tunnistetiedot poistetaan analysointivaiheessa ja säilytetään erillään analysoitavasta tutkimusaineistosta.

12. Henkilötietojesi käsittelyn kesto 

Tutkimuksen aikana:

Henkilötietoja sisältävän tutkimusaineiston säilyttäminen on tärkeää hyvän tieteellisen käytännön takia. Tieteellisessä tutkimuksessa tutkimusaineisto pyritään säilyttämään, jotta tutkimustulokset voidaan jälkikäteen osoittaa oikeiksi ja aiemmin kerättyä aineistoa voidaan hyödyntää myöhemmissä samaa aihetta käsitelevissä tutkimuksissa tai muiden alojen tieteellisissä tutkimuksissa. Tutkimusaineistoon sisältyviä henkilötietoja käsitellään ja säilytetään suojattuna niin, että ainoastaan niitä tarvitsevat henkilöt pääsevät tarkastelemaan tietoja. Osallistujien henkilötiedoista muodostuva rekisteri säilytetään erillään kerätyistä puhenäytteistä ja arvioinneista (eri järjestelmissä).

Hankkeessa kerättyjä henkilötietoja käsitellään viiden vuoden ajan hankkeen päättymisen jälkeen (2031) tutkimukseen liittyvien julkaisujen valmistumiseksi.

Tutkimuksen päättymisen jälkeen:

Tutkimusaineisto säilytetään myöhempää, yhteensopivaa tieteellistä tutkimusta varten tietosuoja-asetuksen vaatimusten mukaisesti: tunnistetiedoin (ei nimiä tai yhteystietoja, mutta ääni)

Missä aineistoa säilytetään tutkimuksen jälkeen ja kuinka kauan: Kielipankki tai muu vastaava, luotettava ja kuratoitu tietoarkisto, pysyvästi.

Tutkimusaineisto poistetaan yliopistojen käyttämiltä tallennusvälineiltä viiden vuoden kuluttua hankkeen päättymisestä (2031).

Tutkimusaineiston säilytys perustuu tietosuoja-asetuksen 5 artiklan 1 kohdan b ja e alakohtiin. Tutkimusaineiston uudesta tutkimuskäytöstä lähetetään tutkittaville uusi tietosuojailmoitus, paitsi jos rekisterinpitäjä ei enää pysty tunnistamaan rekisteröityjä tutkimusaineistosta.

Uudesta tutkimuksesta ei voida lähettää ilmoitusta tutkittaville myöskään silloin, jos tietojen toimittaminen olisi mahdotonta tai kohtuuttoman vaivalloista tai jos se estäisi tai vaikeuttaisi suuresti tutkimustarkoitusten saavuttamista (tietosuoja-asetuksen 14 artiklan 5 kohdan b alakohta).

Aineisto tallennetaan Kielipankkiin, niiden tutkittavien osalta, jotka ovat antaneet tähän luvan, korkeimman suojaustason aineistoksi (RESTRICTED). Restricted-aineistoon myönnetään oikeus henkilökohtaiseen tutkimuskäyttöön vain hakemuksen perusteella. Ennen uutta tutkimuskäyttöä Kielipankki varmistaa, että uusi tutkimustarkoitus on yhteensopiva aineiston alkuperäisen käytön kanssa asetuksen vaatimusten mukaisesti. Kielipankki antaa aineistolle pysyvät tunnisteet.

13. Automatisoitu päätöksenteko

Tutkimuksessa ei tehdä automaattisia päätöksiä, joilla on merkittävä vaikutus tutkittaviin.

14. Sinun oikeutesi ja niiden rajoittaminen 

Alla mainittujen oikeuksien käyttämiseksi ota yhteyttä tämän tietosuojailmoituksen kohdassa 3 nimettyyn tutkimuksen yhteyshenkilöön ja kerro, mitä oikeuksiasi haluat käyttää. 

Sinun oikeutesi rekisteröitynä

Pyrimme toteuttamaan oikeutesi aina, kun se on mahdollista. Oikeuksiesi soveltuvuuteen vaikuttaa esimerkiksi se, millä oikeusperusteella henkilötietojasi käsitellään. Oikeuksien soveltumista arvioimme aina tapauskohtaisesti. Tutkimuksen yhteyshenkilö auttaa sinua oikeuksiesi toteuttamisessa ja kertoo niiden soveltuvuudesta.

Tietosuoja-asetuksen mukaisia oikeuksiasi ovat:

  • saada tietää käsitelläänkö sinun tietojasi,
  • saada pääsy omiin tietoihisi,
  • oikaista virheelliset ja vanhentuneet tietosi,
  • poistaa tietosi ja tulla unohdetuksi,
  • rajoittaa omien tietojesi käsittelyä,
  • siirtää tietosi rekisterinpitäjältä toiselle,
  • vastustaa tietojesi käsittelyä sekä
  • olla joutumatta automaattisen päätöksenteon kohteeksi.

Jostain oikeudesta saatetaan tieteellisen tutkimuksen yhteydessä joutua poikkeamaan esimerkiksi silloin, jos oikeutesi toteuttaminen vaarantaisi koko tutkimuksen. Usein voi olla esimerkiksi niin, ettei kaikkia jo kerättyjä ja tutkimukseen sisällytettyjä tietojasi ole mahdollista poistaa jälkikäteen, mutta tämä ei vaikuta oikeuteesi keskeyttää tutkimukseen osallistuminen.

Lisätietoa oikeuksistasi eri tilanteissa löydät Tietosuojavaltuutetun toimiston verkkosivuilta: https://tietosuoja.fi/rekisteroidyn-oikeudet-eri-tilanteissa

Valitusoikeus

Jos koet, että henkilötietojasi on käsitelty epäasianmukaisesti, voit aina ottaa yhteyttä rekisterinpitäjän tietosuojavastaavaan, jonka yhteystiedot löydät tämän tietosuojailmoituksen kohdasta 4.

Sinulla on myös oikeus tehdä valitus valvovalle viranomaiselle, eli Tietosuojavaltuutetun toimistoon, mikäli katsot, että henkilötietojesi käsittelyssä on rikottu voimassa olevaa tietosuojalainsäädäntöä.

Tietosuojavaltuutetun toimiston yhteystiedot:

Tietosuojavaltuutetun toimisto
https://tietosuoja.fi/ilmoitus-tietosuojavaltuutetulle
Käyntiosoite: Lintulahdenkuja 4, 00530 Helsinki
Postiosoite: PL 800, 00531 Helsinki
Vaihde: 029 56 66700
Sähköposti: tietosuoja(at)om.fi

 

28.2.2025