Aineisto-opas: Video- ja äänitallenneaineistot

Tässä oppaassa video- ja äänitallenneaineistoilla käsitellään tutkimusta varten kuvattuja videoita ja äänitallenteita.

Pidä huolta datanhallinnan osaamisestasi. Datanhallinnan taidot ovat tutkijan perustaitoja. Yhdessä aineistonhallinnan suunnittelun kanssa ne varmistavat, että tutkija tunnistaa ja hallitsee aineiston käsittelyyn liittyvät riskit (esim. tietosuoja, tietoturva, aineiston käyttöoikeudet, aineiston säilytys). Helsingin yliopiston Datatuki järjestää tutkijoille maksutonta datanhallinnan koulutusta. Datatuki myös ohjeistaa ja kouluttaa sekä tarjoaa työkaluja aineistonhallinnan suunnitteluun.

Tässä oppaassa video- ja äänitallenneaineistoilla tarkoitetaan tutkimusta varten kuvattuja videoita ja äänitallenteita, joissa esiintyy ihmisiä.

Suunnittele etukäteen aineiston keruu, säilyttäminen ja käsittely tutkimuksen aikana sekä aineiston arkistointi tai hävittäminen tutkimuksen jälkeen. Jos aineistojen hallintaan ei ole varattu aikaa tai sitä ei ole suunniteltu etukäteen, aineistoista huolehtiminen jää usein julkaisemisen jalkoihin. Seurauksena on, että tutkimuksen kannalta arvokkaiksikin koettuja aineistoja jää järjestelemättömänä eri paikkoihin ja niiden jatkokäyttö voi olla vaikeaa tai mahdotonta. Aineiston jatkokäyttö on huomioitava jo aineistonhallinnan suunnitteluvaiheessa (esim. jatkokäyttölupien ja metadatan tuottamisen takia). Muun muassa Kielipankilta löytyy tiivis muistilista aineistonhallinnan suunnitteluun sekä kattavampi konkreettinen ohjeistus aineiston tuottajalle.

Henkilötietojen keräämistä varten on tehtävä tietosuojailmoitus. Henkilön kuva ja ääni ovat henkilötietoa, joten video- ja äänitallennetun aineiston kerääminen edellyttää tietosuojailmoitusta. Ilmoituksen voi toimittaa tutkittaville myös ennakkoon, ja sitä on hyvä pitää esillä myös tutkimushankkeen verkkosivuilla.

Minimoi henkilötietojen keruu. Tietosuoja-asetuksen mukaan ”tutkimus tulee toteuttaa ilman henkilötietoja aina kun mahdollista”. Henkilötietojen tarpeellisuus on arvioitava mahdollisimman varhaisessa vaiheessa tutkimusta ja kerättävien ”henkilötietojen on oltava riittäviä, olennaisia ja välttämättömiä käsittelyn tarkoituksen kannalta”. (Ks. esim. Tietosuoja: https://tietosuoja.fi/henkilotietojen-minimointi-tieteellisessa-tutkimuksessa)

Sovi aineistojen omistus-, käyttö- ja tekijänoikeuksista myös tutkimusryhmän ja tutkimuksen suorituspaikan kesken. Ennen aineistonkeruuta on tärkeää sopia tutkimusprojektin kumppaneiden kanssa vähintään aineistojen omistus- ja käyttöoikeuksista, käsittelystä, säilyttämisestä ja mahdollisesta avaamisesta. Sopimuksia voi tarkentaa tutkimuksen edetessä. Mitä tulee tekijänoikeuksiin ja lähioikeuksiin, Kielipankin sivuilla on tiivis tietopaketti, ”Alkuperäisen aineiston tekijänoikeus ja lähioikeudet” https://www.kielipankki.fi/tuki/keruuvaiheen-luvat/.

Aineiston tuottamiseen tarvitaan tutkittavien suostumus. Aina kun tutkimukseen osallistuvia taltioidaan ääni- tai videotallenteelle, täytyy huolehtia, että tutkittavat ymmärtävät osallistuvansa tutkimukseen ja antavat luvan tallenteiden tekemiseen. Allekirjoitettua suostumuslomaketta ei tarvita, vaan riittää, että tutkittavia informoidaan tutkimuksen tarkoituksesta.

Aineiston keruu saattaa edellyttää eettistä ennakkoarviointia tai etukäteen hankittua tutkimuslupaa. Jos keräät aineistoa esimerkiksi koulussa, tutkimuslupaa pitää hakea kyseisen kunnan opetus- tai vastaavasta virastosta. Alle 15-vuotiaita koskevaan aineistoon saatetaan tarvita eettinen ennakkoarviointi.

Huolehdi luvista ennen aineistonkeruun aloittamista. Tutkimukseen mahdollisesti tarvittavat luvat ja eettinen ennakkoarviointi on selvitettävä ennen tutkimusaineiston keruun aloittamista. Jos aineisto on tarkoitus sijoittaa hankkeen jälkeen eritysesti tutkimusaineistojen vastuulliseen säilyttämiseen tai julkaisemiseen erikoistuneeseen palveluun, riittävät oikeudet jakaa aineistoa edelleen kolmansille osapuolille on varmistettava jo aineistoa kerätessä. Lupia on vaikea tai mahdotonta saada jälkikäteen.

Hyödynnä yliopiston tarjoamia palveluita aineiston keruussa. Jos keräät aineistoa kentällä, voit lainata laitteistoa HSSH:n pienlaitelainaamosta. Lainaamo neuvoo mahdollisuuksien mukaan sopivan laitteen valinnassa. Aineiston keruuta voi tehdä myös Humanistis-yhteiskuntatieteellisen instituutin (HSSH) Interlab-laboratoriossa, joka tarjoaa mahdollisuudet audiovisuaaliseen työhön (videointi ja haastattelut).

Varmista, että aineisto on jatkokäytettävää. Aineiston jatkokäytön kannalta kannattaa kiinnittää huomiota aineiston tekniseen laatuun ja tallennusformaatteihin, jotta ne ovat yhteensopivia myöhemmän säilytyspaikan kanssa. Nämä tulee huomioida jo aineistonkeruuvaiheessa. Suositeltavimpia ovat laajasti käytössä olevat ja monissa ohjelmissa tuetut formaatit. (Ks. esim. Kielipankin ohje aineiston teknisen muodon valintaan https://www.kielipankki.fi/tuki/tekninen-muoto/ ja aineiston keruuseen https://www.kielipankki.fi/tuki/aineiston-keraaminen/.)

Huomioi metadatanäkökulma jo aineiston keruun aikana. Aineistonkeruu kulkee käsi kädessä kuvailutietojen eli metadatan tuottamisen kanssa. Projektin aikana dokumentointia ovat mm. muuttujien ja koodien selitteet (tietohakemistot, koodikirjat) ja readme-tiedostot. Lisäksi dokumentaatioon liittyvät tiedostojen nimeämiskäytännöt, versionhallinta ja kansiorakenne. On hyvä kuvata menetelmät, lähteet ja paikat, joista aineisto on tarkoitus kerätä. Datanhallinnan perusoppaasta löytyvät metadatan tuottamiseen liittyviä perusasioita. Perinpohjaisia ohjeita on myös Tietoarkiston oppaassa: https://www.fsd.tuni.fi/fi/palvelut/aineistonhallinta/aineiston-kuvailu-ja-metadata/.

Hyödynnä yliopiston tarjoamia palveluita aineiston käsittelyssä ja analysoinnissa. Humanistis-yhteiskuntatieteellisen instituutin (HSSH) Interlab-laboratoriossa on työvälineitä audiovisuaalisen aineiston käsittelyyn ja analysointiin (myös litterointiin ja annotointiin). Aineistojen litterointiin ja annotointiin löytyy ohjeita Kielipankin sivulta: https://www.kielipankki.fi/tuki/annotaatio/. Kielipankin ohjeissa ei mainita keskusteluntutkimuksessa paljon käytettyä litterointiohjelma Transanaa, joka on käytettävissä InterLabissa.

Aineistojen kuvailu on suunniteltava ja resursoitava. Aineistojen kuvailu edistää aineistojen jatkokäyttöä. Dokumentointiin tarvittavat resurssit on varattava hankkeen budjetissa ja aikataulussa. Aineistosta tulee kerätä riittävän tarkat kuvailutiedot, jotka voidaan julkaista esimerkiksi CSC:n tuottamassa ja Kielipankin käyttämässä Meta-Share-palvelussa http://metashare.csc.fi/ – Kielipankki ohjeistaa Meta-Sharen käytössä https://www.kielipankki.fi/tuki/kuvailutiedot/.

Suunnittele versioiden hallinta etukäteen. Tutkimuksen aikana aineistosta syntyy tavallisesti eri versioita. Versioiden hallinta on tärkeää tutkimusprosessin aikana ja sen jälkeen, jos aineisto on relevantti jatkokäytön kannalta. Kielipankin verkkosivulla kerrotaan versioiden hallinnasta erityisesti aineiston avaamisen ja jatkokäytön näkökulmasta, muun muassa uusien versioiden syntymiseen liittyen https://www.kielipankki.fi/tuki/kielivarojen-versiointi/.

Hyödynnä yliopiston palveluja aineiston säilyttämisessä. Tutkimusprojektin aikana aineistoa voi säilyttää omassa kotihakemistossa (jos käyttää aineistoa yksin) tai ryhmähakemistossa. Ohjeita erilaisiin käyttötarkoituksiin soveltuvista säilytysratkaisuista löytyy Helsingin yliopiston Datatuen wikisivun taulukosta https://wiki.helsinki.fi/x/kgV5FQ.

Sensitiivisen datan säilyttäminen. Erityisen sensitiivistä aineistoa voi säilyttää Umpiossa, mutta Umpio sopii pelkkään tutkimuksen aikaiseen säilytykseen. Aineiston käsittely Umpiossa ei ole mahdollista. Jos aineistolla on Helsingin yliopiston ulkopuolisia käyttäjiä, on hyvä käyttää CSC:n sensitiivisen datan säilytyksen palveluja https://research.csc.fi/sensitive-data. Jos aineistoa joutuu tilapäisesti säilyttämään ulkoisella kovalevyllä tai muistitikulla, se pitää suojata salasanalla ja mielellään myös kryptata (ks. Cryptomator -ohjelman käyttö Helpdeskin sivulla https://helpdesk.it.helsinki.fi/ohjeet/tietoturva-ja-pilvipalvelut/tietoturva/cryptomator).

Kielipankki on luonteva säilytyspaikka. Kielentutkimuksessa on vakiintuneita säilytysratkaisuja verrattuna moniin muihin aloihin. Aineistojen avaamisen kannalta keskeisin on Kielipankki (ks. aineistosivu https://www.kielipankki.fi/aineistot/), joka kokoaa teksti-, ääni- ja videoaineistoja. Kielipankkiin voi tallentaa ja sitä voi käyttää myös muilla aloilla kuin kielentutkimuksessa. Sitä ylläpitää suomalaisten yliopistojen, CSC:n ja Kotimaisten kielten keskuksen FIN-CLARIN-konsortio. Esimerkiksi Suomen Akatemia ja useat säätiöt suosittelevat, että kieliaineistojen pitkäaikaissäilytys järjestetään FIN-CLARINin kautta. Kielipankin kautta tarjottavien aineistojen hankkimisesta ja vastaanottamisesta, työkalujen kehityksestä sekä koulutustoiminnasta vastaa Helsingin yliopisto, teknisestä ylläpidosta CSC. Kieliaineiston tuottajan tai omistajan on varmistettava riittävät oikeudet ja luvat aineiston käyttöön ja jatkokäyttöön https://www.kielipankki.fi/tuki/kielivarasopimukset/ sekä varauduttava tekemään kielivarasta tallennussopimus FIN-CLARINin kanssa (ks. ohjeet aineiston tuottajille https://www.kielipankki.fi/tuki/talletus/). On hyvä huomioida myös mahdolliset kustannukset, jotka liittyvät aineiston avaamiseen Kielipankissa (ks. FIN-CLARINin tarjoamat ostopalvelut https://www.kielipankki.fi/tuki/ostopalvelut/).

Poistettavat aineistot tulee hävittää tietoturvallisesti. Etenkin arkaluonteisten aineistojen hävittämisessä tulee tiedostojen kohdalla noudattaa Helpdeskin ohjeistusta https://helpdesk.it.helsinki.fi/ohjeet/tallentaminen-ja-jakaminen/tiedostojen-turvallinen-poistaminen. Fyysiset tallennusmediat, kuten ulkoiset kovalevyt tai CD-levyt voidaan rikkoa; esim. rikottua CD-levyä on mahdotonta korjata. Fyysisten tallenteiden hävittämiseen on myös omia laatikoita, joita voi tiedustella tilapalveluista https://www-db2.helsinki.fi/tto/puhelin.lista.haku?valinta=4&osasto=K50&k1=on&k2=on&k3=off&ilme=yes&kl=0. Myös IT-lähitukea voi aina pyytää hoitamaan hävityksen, mikäli on epävarma tai kyseessä on hyvin sensitiivinen aineisto.

Aineiston versiot aineistoa avattaessa. Versioiden hallinnasta aineiston avaamisen ja jatkokäytön näkökulmasta löytyy ohjeistusta Kielipankin verkkosivulla https://www.kielipankki.fi/tuki/kielivarojen-versiointi/.

Kielipankki 2015-21. Aineistonhallintasuunnitelma. https://www.kielipankki.fi/tuki/aineistonhallintasuunnitelma/

Kielipankki 2015-21. Aineistojen tuottajan ohjeet ja muistilista. https://www.kielipankki.fi/tuki/ohjeita-sisallontuottajille/

Kielipankki:”Henkilötiedot ja tutkittavien henkilöiden yksityisyys” https://www.kielipankki.fi/tuki/keruuvaiheen-luvat/, joka ohjeistaa mm. rekisterinpitäjän määrittelyssä ja henkilötietojen käsittelyssä.

Tietosuoja: tiedonkeruun minimointi: https://tietosuoja.fi/henkilotietojen-minimointi-tieteellisessa-tutkimuksessa

Tietoa tietosuojasta ja Helsingin yliopiston ilmoituspohjat löytyvät Flammasta https://flamma.helsinki.fi/s/HRgMA.

Henkilötietorekisterien keräämistä ja käsittelyä ohjaa EU:n tietosuoja-asetus (GDPR, General Data Protection Regulation) https://tietosuoja.fi/tieteellinen-tutkimus

Kansallinen tietosuojalaki (1050/2018) https://www.finlex.fi/fi/laki/ajantasa/2018/20181050, jossa on tarkennettu tutkimukseen liittyviä kohtia.

Eettisestä ennakkoarvioinnista löytyy tietoa Helsingin yliopiston sivulta: https://www.helsinki.fi/fi/tutkimus/palvelut-tutkijoille/tutkimuksen-eettinen-ennakkoarviointi/ihmistieteet.

Lupapohjia kieliaineiston keräämiseen Kielipankin sivuilla: https://www.kielipankki.fi/tuki/kieliaineiston-keraamislupapohjat/.

Esimerkkinä CLARIN-loppukäyttäjän lisenssin (EULA) ehdot: https://www.kielipankki.fi/tuki/clarin-eula/

Linkki tulossa tähän.