Aineisto-opas: Video- ja äänitallenneaineistot

Tässä oppaassa video- ja äänitallenneaineistoilla käsitellään tutkimusta varten kuvattuja videoita ja äänitallenteita.

Pidä huolta datanhallinnan osaamisestasi. Datanhallinnan taidot ovat tutkijan perustaitoja. Yhdessä aineistonhallinnan suunnittelun kanssa ne varmistavat, että tutkija tunnistaa ja hallitsee aineiston käsittelyyn liittyvät riskit (esim. tietosuoja, tietoturva, aineiston käyttöoikeudet, aineiston säilytys). Helsingin yliopiston Datatuki järjestää tutkijoille maksutonta datanhallinnan koulutusta. Datatuki myös ohjeistaa ja kouluttaa sekä tarjoaa työkaluja aineistonhallinnan suunnitteluun.

Tässä oppaassa video- ja äänitallenneaineistoilla tarkoitetaan tutkimusta varten kuvattuja videoita ja äänitallenteita, joissa esiintyy ihmisiä.

Suunnittele etukäteen aineiston keruu, säilyttäminen ja käsittely tutkimuksen aikana sekä aineiston arkistointi tai hävittäminen tutkimuksen jälkeen. Jos aineistojen hallintaan ei ole varattu aikaa tai sitä ei ole suunniteltu etukäteen, aineistoista huolehtiminen jää usein julkaisemisen jalkoihin. Seurauksena on, että tutkimuksen kannalta arvokkaiksikin koettuja aineistoja jää järjestelemättömänä eri paikkoihin ja niiden jatkokäyttö voi olla vaikeaa tai mahdotonta. Aineiston jatkokäyttö on huomioitava jo aineistonhallinnan suunnitteluvaiheessa (esim. jatkokäyttölupien ja metadatan tuottamisen takia). Muun muassa Kielipankilta löytyy tiivis muistilista aineistonhallinnan suunnitteluun sekä kattavampi konkreettinen ohjeistus aineiston tuottajalle.

Henkilötietojen keräämistä varten on tehtävä tietosuojailmoitus. Henkilön kuva ja ääni ovat henkilötietoa, joten video- ja äänitallennetun aineiston kerääminen edellyttää tietosuojailmoitusta. Ilmoitus on hyvä  toimittaa tutkittaville ennakkoon, ja sitä on syytä pitää esillä myös tutkimushankkeen verkkosivuilla.

Minimoi henkilötietojen keruu. Tietosuoja-asetuksen mukaan ”tutkimus tulee toteuttaa ilman henkilötietoja aina kun mahdollista”. Henkilötietojen tarpeellisuus on arvioitava mahdollisimman varhaisessa vaiheessa tutkimusta ja kerättävien ”henkilötietojen on oltava riittäviä, olennaisia ja välttämättömiä käsittelyn tarkoituksen kannalta”. (Ks. esim. Tietosuoja).

Sovi aineistojen omistus-, käyttö- ja tekijänoikeuksista myös tutkimusryhmän ja tutkimuksen suorituspaikan kesken. Ennen aineistonkeruuta on tärkeää sopia tutkimusprojektin kumppaneiden kanssa vähintään aineistojen omistus- ja käyttöoikeuksista, käsittelystä, säilyttämisestä ja mahdollisesta avaamisesta. Sopimuksia voi tarkentaa tutkimuksen edetessä. Mitä tulee tekijänoikeuksiin ja lähioikeuksiin, Kielipankin sivuilla on tiivis tietopaketti, ”Alkuperäisen aineiston tekijänoikeus ja lähioikeudet”.

Aineiston tuottamiseen tarvitaan tutkittavien suostumus. Aina kun tutkimukseen osallistuvia taltioidaan ääni- tai videotallenteelle, täytyy huolehtia, että tutkittavat ymmärtävät osallistuvansa tutkimukseen ja antavat luvan tallenteiden tekemiseen. Allekirjoitettua suostumuslomaketta ei tarvita, vaan riittää, että tutkittavia informoidaan tutkimuksen tarkoituksesta.

Aineiston keruu saattaa edellyttää eettistä ennakkoarviointia tai etukäteen hankittua tutkimuslupaa. Jos keräät aineistoa esimerkiksi koulussa, tutkimuslupaa pitää hakea kyseisen kunnan opetus- tai vastaavasta virastosta. Alle 15-vuotiaita koskevaan aineistoon saatetaan tarvita eettinen ennakkoarviointi.

Huolehdi luvista ennen aineistonkeruun aloittamista. Tutkimukseen mahdollisesti tarvittavat luvat ja eettinen ennakkoarviointi on selvitettävä ennen tutkimusaineiston keruun aloittamista. Jos aineisto on tarkoitus sijoittaa hankkeen jälkeen eritysesti tutkimusaineistojen vastuulliseen säilyttämiseen tai julkaisemiseen erikoistuneeseen palveluun, on tärkeää varmistaa jo aineistoa kerätessä riittävät oikeudet jakaa aineistoa edelleen kolmansille osapuolille. Lupia on vaikea tai mahdotonta saada jälkikäteen.

Hyödynnä yliopiston tarjoamia palveluita aineiston keruussa. Jos keräät aineistoa kentällä, voit lainata laitteistoa HSSH:n pienlaitelainaamosta. Lainaamo neuvoo mahdollisuuksien mukaan sopivan laitteen valinnassa. Video- ja äännittalenteiden keruuta voi tehdä myös Humanistis-yhteiskuntatieteellisen instituutin (HSSH) Interlab-laboratoriossa, joka tarjoaa mahdollisuudet audiovisuaaliseen työhön (videointi ja haastattelut), joka tarjoaa hyvät olosuhteet laadukkaseen tallentamiseen (videointi ja haastattelut).

Varmista, että aineisto on jatkokäytettävää. Aineiston jatkokäytön kannalta kannattaa kiinnittää huomiota aineiston tekniseen laatuun ja tallennusformaatteihin, jotta ne ovat yhteensopivia myöhemmän säilytyspaikan kanssa. Nämä tulee huomioida jo aineistonkeruuvaiheessa. Suositeltavimpia ovat laajasti käytössä olevat ja monissa ohjelmissa tuetut formaatit. (Ks. esim. Kielipankin ohje aineiston teknisen muodon valintaan ja Kielipankin ohje aineiston keruuseen).

Huomioi metadatanäkökulma jo aineiston keruun aikana. Aineistonkeruu kulkee käsi kädessä kuvailutietojen eli metadatan tuottamisen kanssa. Projektin aikana on syytä dokumentoida myös mm. muuttujien ja koodien selitteet (tietohakemistot, koodikirjat) ja readme-tiedostot. 

Hyödynnä yliopiston tarjoamia palveluita aineiston käsittelyssä ja analysoinnissa. Humanistis-yhteiskuntatieteellisen instituutin (HSSH) Interlab-laboratoriossa on työvälineitä audiovisuaalisen aineiston käsittelyyn ja analysointiin (myös litterointiin ja annotointiin). Aineistojen litterointiin ja annotointiin löytyy ohjeita Kielipankin sivulta. Näiden resurssien lisäksi HSSH:n Interlabissa on käytettävissä myös keskusteluntutkimukseen hyvin soveltuva Transana -ohjelmisto.

Aineistojen kuvailu on suunniteltava ja resursoitava. Aineistojen kuvailu edistää aineistojen jatkokäyttöä. Dokumentointiin tarvittavat resurssit on varattava hankkeen budjetissa ja aikataulussa. Aineistosta tulee kerätä riittävän tarkat kuvailutiedot, jotka voidaan julkaista esimerkiksi CSC:n tuottamassa ja Kielipankin käyttämässä Meta-Share-palvelussaKielipankki ohjeistaa Meta-Sharen käytössä.

Laadukkaaseen dokumentaatioon kuuluvat myös selitykset tiedostojen nimeämiskäytännöistä, versionhallinnasta sekä kansiorakenteesta. On hyvä kuvata menetelmät, lähteet ja paikat, joista aineisto on tarkoitus kerätä. Datanhallinnan perusoppaasta löytyvät metadatan tuottamiseen liittyviä perusasioita. Perinpohjaisia ohjeita on myös Tietoarkiston oppaassa.

Suunnittele versioiden hallinta etukäteen. Tutkimuksen aikana aineistosta syntyy tavallisesti eri versioita. Versioiden hallinta on tärkeää tutkimusprosessin aikana ja sen jälkeen, jos aineisto on relevantti jatkokäytön kannalta. Kielipankin verkkosivulla kerrotaan versioiden hallinnasta erityisesti aineiston avaamisen ja jatkokäytön näkökulmasta, muun muassa uusien versioiden syntymiseen liittyen.

Hyödynnä yliopiston palveluja aineiston säilyttämisessä. Tutkimusprojektin aikana aineistoa voi säilyttää omassa kotihakemistossa (jos käyttää aineistoa yksin) tai ryhmähakemistossa. Ohjeita erilaisiin käyttötarkoituksiin soveltuvista säilytysratkaisuista löytyy Helsingin yliopiston Datatuen wikisivun taulukosta. On hyvä pitää mielessä, että videoaineistot tarvitsevat kohtuullisen paljon levytilaa säilytyksessä. Tämä saattaa myös aiheuttaa lisäkustannuksia.

Sensitiivisen datan säilyttäminen. Erityisen sensitiivistä aineistoa voi säilyttää Umpiossa, mutta Umpio sopii pelkkään tutkimuksen aikaiseen säilytykseen. Aineiston käsittely Umpiossa ei ole mahdollista. Jos aineistolla on Helsingin yliopiston ulkopuolisia käyttäjiä, on hyvä käyttää CSC:n sensitiivisen datan säilytyksen palveluja. Jos aineistoa joutuu tilapäisesti säilyttämään ulkoisella kovalevyllä tai muistitikulla, se pitää suojata salasanalla ja mielellään myös kryptata (ks. esimerkiksi Cryptomator -ohjelman käyttö Helpdeskin sivulla).

Kielipankki on luonteva säilytyspaikka. Kielentutkimuksessa on vakiintuneita säilytysratkaisuja verrattuna moniin muihin aloihin. Aineistojen avaamisen kannalta keskeisin on Kielipankki (ks. aineistosivu), joka kokoaa teksti-, ääni- ja videoaineistoja. Kielipankkiin voi tallentaa ja sitä voi käyttää myös muilla aloilla kuin kielentutkimuksessa. Sitä ylläpitää suomalaisten yliopistojen, CSC:n ja Kotimaisten kielten keskuksen FIN-CLARIN-konsortio. Esimerkiksi Suomen Akatemia ja useat säätiöt suosittelevat, että kieliaineistojen pitkäaikaissäilytys järjestetään FIN-CLARINin kautta. Kielipankin kautta tarjottavien aineistojen hankkimisesta ja vastaanottamisesta, työkalujen kehityksestä sekä koulutustoiminnasta vastaa Helsingin yliopisto, teknisestä ylläpidosta CSC. Kieliaineiston tuottajan tai omistajan on varmistettava riittävät oikeudet ja luvat aineiston käyttöön ja jatkokäyttöön sekä varauduttava tekemään kielivarasta tallennussopimus FIN-CLARINin kanssa (ks. ohjeet aineiston tuottajille). On hyvä huomioida myös mahdolliset kustannukset, jotka liittyvät aineiston avaamiseen Kielipankissa (ks. FIN-CLARINin tarjoamat ostopalvelut).

 

Poistettavat aineistot tulee hävittää tietoturvallisesti. Etenkin arkaluonteisten aineistojen hävittämisessä tulee tiedostojen kohdalla noudattaa Helpdeskin ohjeistusta. Fyysiset tallennusmediat, kuten ulkoiset kovalevyt tai CD-levyt voidaan rikkoa; esim. rikottua CD-levyä on mahdotonta korjata. Fyysisten tallenteiden hävittämiseen on myös omia laatikoita, joita voi tiedustella tilapalveluista. Myös IT-lähitukea voi aina pyytää hoitamaan hävityksen, mikäli on epävarma tai kyseessä on hyvin sensitiivinen aineisto. Täsmätietoa IT-kierrätyksestä löydät Flammasta.

 

Aineiston versiot aineistoa avattaessa. Versioiden hallinnasta aineiston avaamisen ja jatkokäytön näkökulmasta löytyy ohjeistusta Kielipankin verkkosivulla.

PDF-versio lisätään pian.