Digitaalisten aineistojen professuurin kohteena ovat tekstimateriaalit humanistisen ja yhteiskuntatieteellisen tutkimuksen apuna. Timo Honkela puhuu digitaalisesta humanismista, jossa ilmiöitä voidaan tutkia sen mukaan, miten ne näkyvät aineistossa.
– Tavallaan on kyse big datasta, mutta nyt keskitytään teksteihin, ei vain tilastoihin ja numeroihin, Honkela sanoo.
Kone oppii aineistoista itse
Tähän asti on ajateltu, että tietokoneet tekevät sitä, mitä ne on ohjelmoitu tekemään.
– Koneoppimisen myötä tilanne muuttuu radikaalisti: koneille annetaan aineistoa ja ne oppivat itse jäsentämään tietoa sitä paremmin, mitä enemmän aineistoa kertyy.
Järjestelmä voi käydä läpi jopa miljardeja tekstidokumentteja ja analysoida tietoa valmiiksi tutkijalle.
– Jos halutaan vaikkapa ymmärtää historiallisia tapahtumia miljoonien sanomalehtiartikkelien kautta, se ei onnistu suurenkaan tutkijaryhmän voimin. Kone voi tässä auttaa.
Tieteen tekeminen mullistuu
Uusi teknologinen kehityskulku vaikuttaa Honkelan mukaan siihen, miten tiedettä ylipäätään tehdään. Kyseessä on paitsi uusi tapa saada materiaalia, myös uusi tapa muodostaa tietoa. Tähän asti tietoa on kerätty sirpaleisesti, koska tiedon esittämisellä ja myös ihmisen kognitiivisilla kyvyillä on rajansa.
– Jatkossa humanististen ja sosiaalitieteiden monimutkaisia ilmiöitä voidaan lähestyä niiden luonteelle uskollisella tavalla, eikä tietoa tarvitse ylenmäärin redusoida tai pelkistää.
Resurssit omaan haltuun
Tällä hetkellä kaikki tieteelliset tietokannat ovat yksityisten yritysten ylläpitämiä. Honkelan mukaan tiedon saatavuuden kannalta kaupallisuudessa on ongelmia.
– Kirjastojen rooli tulevaisuudessa on kehittää tietoyhteiskunnan resursseja, joita yliopistot itse hallinnoivat.
Honkelan mukaan tulevaisuudessa koneoppiminen mahdollistaa tekstin muokkaamisen sen lukijat huomioiden. Esimerkiksi jos tutkija on kirjoittamassa esitelmää maallikoille, kone näyttää, mitkä kohdat saattavat olla heille vaikeita ymmärtää.
Koneet vievät työt
Honkelan mukaan kone voi tulevaisuudessa oppia tulkitsemaan huumoria tai se voi huomauttaa, jos ihminen on huomaamattaan tyly sähköpostia kirjoittaessaan.
Kuulostaa pelottavalta. Vievätkö koneet työpaikkoja lähitulevaisuudessa?
– Lähivuosikymmenten kehitys on vaarassa viedä työpaikkoja itse kultakin. Yhteiskunnallisesti pitää pystyä päättämään, miten automaation avulla syntyvä hyvinvointi ja varallisuus jaetaan oikeudenmukaisesti, Honkela vastaa.
Digitaalisten aineistojen tutkimuksen professori Timo Honkelan juhlaluentoa koneoppimisesta humanismin palveluksessa voi tulla kuuntelemaan keskiviikkona 28.5. päärakennuksen pieneen juhlasaliin kello 15.15 alkaen.