Big Data aloittaa Studia Generalian Tiede ratkaisee -luentosarjan

Luonnontieteissä, teollisuudessa ja lääketieteessä sovelletaan nykyään laajasti menetelmiä, joilla suurista tietoaineistoista saadaan esille mielenkiintoisia ja hyödyllisiä johtopäätöksiä. Humanistiset ja yhteiskuntatieteet ovat olleet suurelta osin paitsiossa.

Professori Timo Honkelan mukaan mittaukset ja muut numeroina esitetyt tiedot on helppoa analysoida perinteisillä tilastollisilla menetelmillä.

– Laadullinen tieto ja tekstikokoelmat ovat huomattavasti haasteellisempi kohde, Honkela toteaa.  

– Erityisen haastavaksi tutkimus muodostuu, kun kohteena ovat humanististen ja yhteiskuntatieteiden ilmiöt.

Kielen tulkinta haasteena

Tietokoneilla on jo pitkään rakennettu malleja esimerkiksi kielten rakenteesta, mutta kielellisten merkitysten avaaminen on ollut ihmisten tehtävä. Erityistä hienovaraisuutta tarvitaan, kun kieltä käytetään vaikkapa yhteiskunnan, politiikan, historian tai kielen itsensä kuvaamiseen.

Suuria tietoaineistoja ja koneoppimista hyödyntävät kuitenkin myös humanistit. Professori Honkela kertoo 6.10.  Studia Generalia -esityksessään niistä edistysaskeleista, joita digitaaliset ihmistieteet ovat viime aikoina ottaneet. Humanististen alojen suuria tietoaineistoja voidaan käydä läpi tietokoneiden avulla ilman, että syyllistytään yksinkertaistavaan tulkintaan.

– Inhimillisen tulkinnan herkkyyttä ja tilannekohtaisuutta voidaan tutkia uusilla tavoilla.

Humanistisessa ja yhteiskunnallisessa tutkimuksessa konteksti on avainsana

Honkela näkee uusia mahdollisuuksia tieteenalakokonaisuuden aseman vahvistamisessa. Humanististen ja yhteiskuntatieteiden merkitys kasvaa ja tärkeitä ilmiöitä koskeva tutkimus jatkuu - vahvistettuna näiden alojen meta-analyysilla, jossa kone voidaan laittaa lukemaan miljoonia ja taas miljoonia tekstejä.

– Urakka ei ole helppo, koska tekstien sisältöjen tulkinta ei ole pelkkää yksioikoista sanamäärien laskentaa, Honkela korostaa.

– Yksi avaintekijä on kontekstien analyysi.

Laskennallinen näkökulma poliittiseen keskusteluun

Viestinnän tohtoriopiskelija Salla-Maaria Laaksonen on tutkinut vuoden 2015 eduskuntavaaleja digitaalisen aineiston pohjalta.  Digivaalit 2015-hankkeessa kerättiin 1,5 miljoonan viestin aineisto sosiaalisen ja perinteisen median eri palveluista viime eduskuntavaalien alla. Hankkeessa analysoitiin verkkojulkisuuden valta-asetelmia laskennallisen tekstianalyysin menetelmin.

Salla-Maaria Laaksonen toimii myös tutkijana Citizen Mindscapes -tutkimuskollektiivissa, joka on viime vuoden aikana avannut koko Suomi24-aineiston avoimeen tutkimuskäyttöön. 67 miljoonan viestin aineistossa riittää pengottavaa useiden eri alojen tutkijoille. Laaksonen toivookin laskennallisten ja digitaalisten menetelmien käytön leviävän suomalaisessa tutkimuksessa. 

– Kaikesta verkkotoiminnastamme jää paljon digitaalisia jälkiä, joiden syntymistä kaikki käyttäjät eivät aina edes tiedosta. Yhteiskuntatieteilijälle ne voivat olla merkittävä tapa ymmärtää paremmin ihmisten, yhteisöjen ja yhteiskunnan toimintaa, Laaksonen kiteyttää.

Big Data-yleisöluento on osa Helsingin yliopiston Thinkfest-tapahtumaa. Tervetuloa!

Studia Generalian syksyn luentosarja Tiede ratkaisee alkaa 6.10. klo 17 ja jatkuu torstaisin samaan aikaan 10.11. asti Porthanian luentosalissa PI (Yliopistonkatu 3).