Tietosuojaseloste

Suomen Akatemian (2019-2023) ja Svenska Folkskolans vänner ry:n (2015-2017) rahoittaman DigiTala-tutkimushankkeen tietosuojaseloste.

Lyhyt osoite: helsinki.fi/fi/digitala/tietosuoja

Suomen Akatemian (2019-2023) ja Svenska Folkskolans vänner ry:n (2015-2017) rahoittamassa DigiTala-tutkimuksessa käytetään aineistona henkilötietoja. Tämän selosteen tarkoitus on antaa tietoa käsiteltävistä henkilötiedoista sekä siitä, mistä henkilötiedot ovat peräisin ja miten niitä käytetään ja on käytetty tutkimuksessa. Selosteen lopussa kerrotaan tarkemmin, mitä oikeuksia rekisteröidyillä on.

Tutkimukseen osallistuminen ja henkilötietojen antaminen on vapaaehtoista. Sinuun ei kohdistu mitään negatiivista seuraamusta, jos et osallistu tutkimukseen tai jos keskeytät osallistumisesi tutkimukseen. Tutkimukseen osallistuminen ei vaikuta muuhun kielitaidon arviointiin (esim. kurssiarvosanasi, YKI-kokeen tulos).

1. Tutkimuksen rekisterinpitäjä

Helsingin yliopisto, PL 3 (Fabianinkatu 33), 00014 Helsingin yliopisto

Jyväskylän yliopisto, Seminaarinkatu 15, PL 35, 40014 Jyväskylän yliopisto

Aalto-yliopisto, PL 11000 (Otakaari 1B), 00076 AALTO

2. Yhteyshenkilö ja vastuullinen tutkija

Yhteyshenkilö tutkimusta koskevissa asioissa / vastuullinen tutkija:

  • Nimi: Raili Hildén
  • Tiedekunta/osasto/yksikkö: Helsingin yliopisto / Kasvatustieteellinen tiedekunta
  • Osoite: PL 9 (Siltavuorenpenger 3A), 000014 Helsingin yliopisto
  • Puhelinnumero: +358504482514
  • Sähköpostiosoite: raili.hilden@helsinki.fi

3. Tietosuojavastaavan yhteystiedot

Helsingin yliopiston tietosuojavastaavaan saa yhteyden sähköpostiosoitteesta tietosuoja@helsinki.fi, Jyväskylän yliopiston tietosuojavastaava tietosuoja@jyu.fi ja Aalto-yliopiston tietosuojavastaava tietosuojavastaava@aalto.fi

4. Kuvaus tutkimushankkeesta ja henkilötietojen käsittelyn tarkoitus

DigiTala-hankkeessa kehitetään automaattista puheentunnistusta (automatic speech recognition, ASR) hyödyntäviä sovelluksia kielitaidon arviointiin. Tavoitteena on selvittää, miten toisen ja vieraaen kielen puhumista voidaan arvioida esimerkiksi ylioppilastutkinnon kaltaisissa isoissa ja tärkeissä kielikokeissa. Sovellusten avulla opiskelijat voivat myös harjoitella ääntämistä ja puhumista itsenäisesti.

Ensimmäiset versiot sovelluksista suunnitellaan suomalaisille lukiolaisille, jotka opiskelevat ruotsia tai suomea toisena kotimaisena kielenä. Lukiolaisten lisäksi aineistoa kerätään myös yleisten kielitutkintojen (YKI) suomen ja ruotsin kielen kokeisiin osallistujilta ja haastattelijoilta. Aineistoa kerätään myös opettajilta ja opiskelijoiden puhenäytteitä kuuntelevilta ihmisarvioijilta.

DigiTala-hankkeessa työskentelee tutkijoita Helsingin yliopistosta, Aalto-yliopistosta ja Jyväskylän yliopistosta. Helsingin yliopisto vastaa sovelluksen pedagogisesta sisällöstä sekä yhteistyöstä koulujen ja sidosryhmien kanssa. Aalto-yliopisto vastaa puheen tunnistuksen ja automaattisen palautteen kehittämisestä. Lisäksi Aalto yliopisto vastaa tutkimusaineiston säilyttämisestä. Jyväskylän yliopisto vastaa puhenäytteiden analysoimisesta ja arvioijien kouluttamisesta.

5. Mitä tietoja tutkimusaineisto sisältää

A) Lukioilta projektin toisessa vaiheessa (2019-2023) kerättävä aineisto:

  • Opiskelijoiden nimet, syntymäajat, koulut, yhteystiedot, suostumukset
  • Opiskelijoiden äänitteet (puhetta, mahdollisesti myös videota kasvoista)
  • Opiskelijoiden koesuoritukset (vastaukset, pisteet, arvosana)
  • Opiskelijoiden taustatiedot (esim. montako kurssia opiskeltuna, mahdollisesti kysymyksiä kielitaustasta, kielten opiskelusta, suullisesta kielitaidosta, sukupuoli, äidinkieli)
  • Opiskelijoiden itsearviot omasta kielitaidostaan / koesuorituksesta
  • Opiskelijoiden mielipiteet suorittamastaan kokeesta (kysely, haastattelu)
  • Puheentunnistimen antama arvio opiskelijan suorituksesta (automaattinen arviointi)
  • Opettajien nimet ja yhteystiedot
  • Opettajien taustatiedot (esim. sukupuoli, ikä, äidinkieli, kielitaito, kysymyksiä opetusmenetelmistä)
  • Opettajien arviot koesuorituksista
  • Opettajien käsitykset ja mielipiteet kehitettävästä työkalusta (kysely, haastattelu)

B) Arvioijilta projektin toisessa vaiheessa (2019-2023) kerättävä aineisto:

  • Arvioijien nimet ja yhteystiedot, suostumukset
  • Arvioijien taustatiedot (esim. äidinkieli, kielitaito, kokemus)
  • Arvioijien antamat arviot opiskelijoiden suorituksista (yksittäiset koekysymykset, kokonaisarvio)
  • Arvioijien palautteet kehitettävästä työkalusta (kysely, haastattelu)

C) YKI-kokeiden osallistujilta ja haastattelijoilta (suomen ja ruotsin kokeet) projektin toisessa vaiheessa (2019-2023) kerättävä aineisto:

  • Osallistujien nimet, syntymäajat, suostumukset
  • Osallistujien koesuoritukset (suulliset ja kirjalliset suoritukset) ja arvosanat
  • Osallistujien taustatiedot (äidinkieli, ikä, sukupuoli)
  • Haastattelijoiden nimet, suostumukset ja äänitteet (audio/video)

D) Muilta sidosryhmiltä projektin toisessa vaiheessa (2019-2023) kerättävä aineisto:

  • Ylioppilaskoetehtävien laatijoiden palaute ja kommentit kehitettävästä työkalusta
  • Opetushallituksen palaute ja kommentit kehitettävästä työkalusta

E) Projektin ensimmäisessä vaiheessa (2015-2017) kerätty aineisto sisältää lukiolaisten vastaukset ruotsin kielen suulliseen kokeeseen. Kokeessa opiskelijat vastasivat tietokoneella suoritettaviin koetehtäviin, joissa vastaukset äänitettiin. Osa vastauksista arvioitiin ja/tai kirjoitettiin puhtaaksi tekstimuotoon.

F) Aikuisopiskelijoilta projektin toisessa vaiheessa (2019-2023) kerättävä aineisto:

  • Osallistujien suostumukset ja sähköpostiosoitteet
  • Osallistujien taustatiedot (äidinkieli, ikä, sukupuoli, kielitaito)
  • Osallistujien mielipiteet suorittamastaan kokeesta (kysely)
  • Osallistujien äänitteet (puhetta)

6. Mistä lähteistä henkilötietoja kerätään

Projektin toisessa vaiheessa suunnittelemme suomen ja ruotsin kielen puhumista mittaavat kokeet, joissa lukiolaiset vastaavat koetehtäviin tietokoneella. Keräämme opiskelijoilta kokeessa puhenäytteitä (koevastaukset). Lisäksi opiskelijat vastaavat kyselyyn, jonka avulla kartoitetaan heidän taustatietojaan, heidän mielipiteitään suorittamastaan kokeesta sekä itsearviointia omasta kielitaidostaan. Joitakin opiskelijoita myös haastatellaan, jotta saadaan palautetta ja kehitysehdotuksia sovellukseen liittyen.

Lisäksi suomen ja ruotsin YKI-kokeisiin osallistuvien koevastauksia ja suoritusten arviointeja käytetään tutkimuksessa. Jyväskylän yliopisto lähettää koepäivän jälkeen YKI-osallistujille kyselyn, jolla pyydetään suostumus suoritusten luovuttamiseen sekä osallistujien taustatiedot. Jyväskylän yliopisto pyytää myös YKI-haastattelijoilta suostumukset käyttää tutkimuksessa äänitteitä, joilla he esiintyvät.

Opiskelijoiden ja YKI-osallistujien lisäksi aineistoa kerätään opettajilta ja ihmisarvioijilta, jotka kuuntelevat ja arvioivat opiskelijoiden puhenäytteitä. Sekä opettajat että arvioijat vastaavat taustatietokyselyyn. Osaa heistä myös haastatellaan palautteen ja kehitysehdotuksien keräämiseksi. Edellisten lisäksi ylioppilastutkinnon kielikokeiden laatijoilta ja Opetushallituksen opetusneuvoksilta kerätään palautetta ja kommentteja kehitystyöhön.

Lukio-opiskelijoiden suoriutumista kyseisessä puhumisen kokeessa halutaan verrata kunkin opiskelijan tuloksiin ylioppilastutkinnossa. Tähän kysytään tutkittavilta suostumus. Tiedot tutkittavien ylioppilaskoetuloksista pyydetään ylioppilastutkintolautakunnalta.

Koronatilanteen takia osa aineiston keruusta tapahtuu etänä. Käytämme Helsingin ja Jyväskylän yliopiston Zoom-videoneuvottelutyökalua, jossa video- ja ääniliikenne kulkee Pohjoismaissa. Videoneuvottelut tallennetaan pilven sijaan tutkijan tietokoneelle.

Projektin ensimmäisessä vaiheessa (2015-2017) puheaineisto kerättiin lukio-opiskelijoilta, jotka suorittivat suullista kielitaitoa mittaavan ruotsin kokeen tietokoneella. Tämän jälkeen ääninäytteet kirjoitettiin tekstimuotoon ja ihmisarvioijat arvioivat niitä.

7. Arkaluonteiset henkilötiedot

Tutkimuksessa ei käsitellä tietosuoja-asetuksen 9 artiklan mukaisia erityisiä henkilötietoryhmiä (eli arkaluonteisia henkilötietoja).

Koetehtävät sekä kyselylomakkeen ja haastattelujen kysymykset suunnitellaan niin, että niissä ei ilmenisi arkaluonteisia henkilötietoja (kuten etninen alkuperä, poliittiset mielipiteet tai terveyteen liittyvät kysymykset).

8. Henkilötietojen käsittelyn oikeusperuste

Henkilötietoja käsitellään seuraavalla yleisen tietosuoja-asetuksen 6 artiklan 1 kohdan mukaisella perusteella: yleistä etua koskeva tehtävä, tieteellinen tutkimus.

9. Tietojen vastaanottajat

Tietosuojailmoituksen laatimishetkellä tiedossa olevat vastaanottajat:

  • Projektitutkijat (kaikki aineisto)
  • Aineiston keruuseen liittyvät palveluntarjoajat:
  • Helsingin ja Jyväskylän yliopiston Zoom-videoneuvottelutyökalu Funet Miitti (etäyhteydet, haastattelut, palautekeskustelut, koulutukset)
  • Jyväskylän yliopiston (YKI-aineiston osalta) ja Aalto-yliopiston Webropol-kyselytyökalu (suostumus- ja taustatietokysely)
  • Ylioppilastutkintolautakunnan jaokset (julkaistavat äänite-esimerkit)
  • Suomen kielten opettajien liitto (julkaistavat äänite-esimerkit)
  • Opettajien täydennyskoulutus (julkaistavat äänite-esimerkit)
  • Tutkimukseen osallistuvat kielten opettajat (ääninäytteet)
  • Projektin rekrytoimat arvioijat (ääninäytteet)
  • Projektin rekrytoimat litteroijat (ääninäytteet, haastatteluaineistot)
  • Aineisto tallennetaan projektin päätyttyä Kielipankkiin niiden tutkittavien osalta, jotka ovat antaneet tähän luvan (nimiä, syntymäaikoja, koulutietoja tai yhteystietoja ei tallenneta Kielipankkiin)
  • Projektin tutkimusyhteistyökumppanit Itä-Suomen yliopisto (Joensuu, Suomi)

10. Tietojen siirto Euroopan talousalueen ulkopuolelle

Tietoja ei siirretä Euroopan talousalueen ulkopuolelle.

11. Automatisoitu päätöksenteko

Tutkimuksessa ei tehdä automaattisia päätöksiä, joilla on merkittävä vaikutus tutkittaviin.

12. Henkilötietojen suojaus

Tutkimusaineistoon sisältyviä henkilötietoja käsitellään ja säilytetään suojattuna niin, että ainoastaan niitä tarvitsevat henkilöt pääsevät tarkastelemaan tietoja. Osallistujien henkilötiedoista muodostuva rekisteri säilytetään erillään kerätyistä puhenäytteistä ja arvioinneista (eri järjestelmissä).

Tietojärjestelmissä käsiteltäviä tietoja suojataan seuraavilla tavoilla: käyttäjätunnus ja salasana, käytön rekisteröinti/lokitus, kulunvalvonta, salaus/kryptaus

Manuaalista (esim. paperimuodossa tai muuten aineellisessa muodossa) olevaa aineistoa suojataan seuraavilla tavoilla: Lukitussa kaapissa, johon pääsy on ainoastaan Helsingin yliopiston ja Jyväskylän yliopiston vastuullisilla tutkijoilla (Raili Hildén & Mikko Kuronen).

Suorien tunnistetietojen käsittely: Suorat tunnistetiedot poistetaan analysointivaiheessa ja säilytetään erillään analysoitavasta tutkimusaineistosta. Opiskelijoiden ääninäytteisiin viitataan tutkimustunnisteella nimen sijaan.

13. Henkilötietojen käsittelyn kesto tässä tutkimuksessa

Henkilötietoja sisältävän tutkimusaineiston säilyttäminen on tärkeää hyvän tieteellisen käytännön takia. Tieteellisessä tutkimuksessa tutkimusaineisto pyritään säilyttämään, jotta tutkimustulokset voidaan jälkikäteen osoittaa oikeiksi ja aiemmin kerättyä aineistoa voidaan hyödyntää myöhemmissä tutkimuksissa.

Projektin toisessa vaiheessa (2019-2023) kerättyä aineistoa käsitellään viiden vuoden ajan projektin päätyttyä, jotta tutkimukseen liittyvät julkaisut saadaan valmiiksi.

Projektin ensimmäisessä vaiheessa (2015-2017) kerättyä pseudonymisoitua aineistoa säilytetään Aalto-yliopistolla 15 vuoden ajan.

14. Henkilötietojen käsittely tutkimuksen päättymisen jälkeen

Tutkimusaineisto hävitetään projektitutkijoiden käyttämiltä tallennusvälineiltä projektia (2019-2023) seuraavien viiden vuoden jälkeen, jotta tutkimukseen liittyvät julkaisut saadaan valmiiksi.

Tutkimusaineisto säilytetään myöhempää, yhteensopivaa tieteellistä tutkimusta varten tietosuoja-asetuksen vaatimusten mukaisesti: ilman suoria tunnistetietoja, kuitenkin sisältäen äänet ja tutkimustunnisteet

Tutkimusaineiston säilytys perustuu tietosuoja-asetuksen 5 artiklan 1 kohdan b ja e alakohtiin.

Ennen uutta tutkimuskäyttöä Kielipankki varmistaa, että uusi tutkimuskäyttö on yhteensopivaa aineiston alkuperäisen käyttötarkoituksen kanssa asetuksen vaatimusten mukaisesti. Tutkimusaineiston uudesta tutkimuskäytöstä ei lähetetä rekisteröidyille uutta tietosuojailmoitusta, sillä rekisterinpitäjä ei enää pysty tunnistamaan rekisteröityjä tutkimusaineistosta ilman kohtuutonta vaivaa.

Missä aineistoa säilytetään ja kuinka kauan: Kielipankki, pysyvästi

Kielipankkiin tallennettavasta aineistosta poistetaan nimet ja mahdolliset muut suoraan osallistujaan viittaavat tunnisteet, mutta tutkittavien tunnistaminen on teoriassa silti mahdollista äänen perusteella. Aineisto tallennetaan Kielipankkiin korkeimman suojaustason aineistoksi (RESTRICTED). Restricted-aineistoon myönnetään oikeus henkilökohtaiseen tutkimuskäyttöön vain hakemuksen perusteella.

15. Mitä oikeuksia rekisteröidyllä on ja oikeuksista poikkeaminen

Yhteyshenkilö tutkittavan oikeuksiin liittyvissä asioissa on tämän ilmoituksen kohdassa 1 mainittu henkilö.

Rekisteröidyn oikeudet

Tietosuoja-asetuksen mukaan rekisteröidyllä on oikeus:

  • saada pääsy tietoihin
  • oikaista tietoja
  • poistaa tiedot ja tulla unohdetuksi
  • rajoittaa tietojen käsittelyä
  • siirtää tiedot järjestelmästä toiseen
  • vastustaa tietojen käsittelyä
  • olla joutumatta automaattisen päätöksenteon kohteeksi.

Rekisteröity ei kuitenkaan voi käyttää kaikkia oikeuksia kaikissa tilanteissa. Tilanteeseen vaikuttaa esimerkiksi se, millä perusteella henkilötietoja käsitellään.

Tarkempaa tietoa rekisteröidyn oikeuksista eri tilanteissa löytyy tietosuojavaltuutetun verkkosivuilta: https://tietosuoja.fi/rekisteroidyn-oikeudet-eri-tilanteissa

Oikeuksien soveltuminen

Jos henkilötietojen käsittely tutkimuksessa ei edellytä rekisteröidyn tunnistamista eikä rekisterinpitäjä pysty tunnistamaan rekisteröityä, oikeutta tietojen tarkastamiseen, oikaisuun, poistoon, käsittelyn rajoittamiseen, ilmoitusvelvollisuuteen ja siirtämiseen ei sovelleta, ellei rekisteröidy anna tunnistamisen mahdollistavia lisätietoja (tietosuoja-asetuksen 11 artikla).

Oikeuksista poikkeaminen

Tietosuoja-asetus ja Suomen tietosuojalaki mahdollistavat tietyistä rekisteröidyn oikeuksista poikkeamisen silloin, kun henkilötietoja käsitellään tieteellisessä tutkimuksessa ja oikeuksien toteuttaminen estäisi tai vaikeuttaisi suuresti käsittelyn tarkoitusten saavuttamista.

Tarvetta poiketa rekisteröidyn oikeuksista arvioidaan aina tapauskohtaisesti.

Valitusoikeus

Sinulla on oikeus tehdä valitus tietosuojavaltuutetun toimistoon, mikäli katsot, että henkilötietojesi käsittelyssä on rikottu voimassa olevaa tietosuojalainsäädäntöä. Yhteystiedot:

  • Tietosuojavaltuutetun toimisto
  • Käyntiosoite: Ratapihantie 9, 6. krs, 00520 Helsinki
  • Postiosoite: PL 800, 00521 Helsinki
  • Vaihde: 029 56 66700
  • Faksi: 029 56 66735
  • Sähköposti: tietosuoja(at)om.fi

19.11.2020