Hackathon toi yhteen humanistit ja tietojenkäsittelijät

Helsinki Digital Humanities Hackathonissa humanistit ja tietojenkäsittelytieteilijät tekivät menetelmäharjoituksia ja opettelivat vuoropuhelua.

Humanistilla on kysymys. Tietojenkäsittelytieteilijällä on menetelmä. Heidät saattoi yhteen Helsinki Digital Humanities Hackathon 2016. Sen aikana humanistit ja tietojenkäsittelytieteilijät työskentelivät yhdessä viikon ajan intensiivisesti erilaisten digitaalisten aineistojen parissa ja etsivät vastauksia tutkimuskysymyksiin.

– Hackathon on uuden Digitaalinen humanismi -opintomoduulin loppuhuipentuma, mutta se on avoin kaikille kiinnostuneille. Täällä on väkeä Helsingin yliopiston lisäksi myös Aalto-yliopistosta, kertoo digitaalisten aineistojen tutkimuksen professori Mikko Tolonen.

Neljä työryhmää työskentelee kukin oman aineistonsa parissa. Jokaisessa työryhmässä on sekä humanisteja että tietojenkäsittelytieteilijöitä.

– Ryhmät tekevät viikon aikana pienimuotoisen tutkimusprojektin. Kaikki ei varmastikaan tule valmiiksi, sillä datan käsittely vie paljon aikaa, mutta projekteja voidaan jatkaa tämän viikon jälkeenkin, Tolonen sanoo.

Viikon lopuksi ryhmät tuottavat posterin ja kertovat muille tuloksistaan.

– Me opettajat ja ryhmien ohjaajat olemme koko viikon läsnä, mutta ryhmät ovat pitkälti itseohjautuvia.

Aalto-yliopistosta mukana ovat opettajat Jukka Suomela ja Eetu Mäkelä.

Ylen ohjelmien Mitä, Missä, Milloin?

YLE-ryhmä oli saanut aineistokseen Yleisradion ohjelmien digitaalisen arkiston vuosilta 1957–1990. Aineisto on tässä laajuudessa ensimmäistä kertaa tutkijoiden käytössä.

– Ensimmäiseksi meidän piti selvittää, mitä aineisto pitää sisällään. Siitä ei ole YLEssäkään tarkkaa tietoa, kertoo viestinnän tutkija ja ryhmän vetäjä Salla-Maaria Laaksonen.

Ryhmällä ei siis ollut käytössä itse ohjelmia, vaan niistä YLEn arkistoon koottu digitaalinen aineisto, metadataa, josta näkyy muun muassa kunkin arkistoidun ohjelman lähetysaika, otsikko ja kuvailu.

– Teimme paljon kaikenlaisia aineiston testauksia, jotta saimme kuvan siitä, mitä datassa on. Aluksi kategorisoimme ohjelmat yhdeksään eri tyyppiin, kuten uutisiin, asiaohjelmiin, urheiluun ja kulttuuriohjelmiin, Laaksonen kuvailee.

– Törmäsimme myös aineiston rajoituksiin, esimerkiksi vain osa ohjelmista on arkistoitu. 1970-luvullakin on aukkoja, sillä nauhoja on käytetty uudelleen.

Aineistolta voi kysyä monenlaisia kysymyksiä. YLE-ryhmä tutki esimerkiksi, miten Urho Kekkonen näkyy aineistossa. Ensin oli karsittava muut Kekkoset, mutta kun se oli tehty, Kekkonen sai 1202 mainintaa. Aineistosta näkyy, minä vuosina Kekkonen esiintyi eniten YLEn kanavilla ja millaisissa ohjelmatyypeissä.

Ryhmä kokeili erilaisia suuren datan käsittelyyn kehitettyjä tietojenkäsittelytieteiden menetelmiä. Niiden avulla voi tutkia vaikka suomettumisen ja kylmän sodan näkymistä eri ohjelmissa. Tai katsoa, miten eri sukupuolet tai puolueet ovat esillä. Jopa sitä, miten eri urheilulajit ovat saaneet TV-aikaa, voi lähestyä tämän aineiston avulla.

– Tämä aineisto on eräänlainen kansakunnan muisti, YLEn ohjelmien Mitä, Missä, Milloin, Laaksonen sanoo.

Uusi yhteistyön kieli

– Tämä on ollut hieno viikko. Minua kyllä vähän pelotti tulla tänne, mutta yhteistyö eritaustaisten ihmisten kanssa on sujunut todella hyvin. Olemme oppineet ymmärtämään toisiamme, kertoo Digitaalinen humanismi -opintomoduulissa opiskeleva ranskalaisen filologian opiskelija Julia Poutanen.

YLE-ryhmä raportoikin viikon päätteeksi, että uusien välineiden, metodien ja isojen aineistojen käsittelyn lisäksi he oppivat uuden kielen. Uudella kielellä voi pyytää apua muilta. Ja niin ratkeavat ongelmat, joita suuri aineisto, kaatuilevat tietokoneet ja lukuisat virheilmoitukset tuottavat.

Digital Humanities Helsinki

Lue lisää aiheesta: Datatiede