Valtteri-botti tuottaa itsenäisesti vaaliuutisia eri kielillä

Poikkitieteellinen tutkimuskonsortio Immersive Automation on alkuvuodesta valmistellut vaalibottia, joka kirjoittaa itsenäisesti uutisia sunnuntain kuntavaalituloksista.

Valtteriksi kutsuttu botti (vaalibotti.fi) on ryhmän ensimmäinen yhteinen tuotos, jonka tulosten perusteella tutkimusryhmä jatkaa työtään uutisautomaation saralla. Botti tuottaa tekstiä suomeksi, ruotsiksi ja englanniksi kaikista Suomen kunnista.

Kieliteknologiaan erikoistunut data-analyytikko Leo Leppänen Helsingin yliopiston tietojenkäsittelytieteen laitokselta on kehittänyt uutisgeneraattoria viime viikkojen ajan.

– Generaattorin ensimmäinen versio on tehty pitkälti käsin. Kokemusten perusteella pyrimme sitten tunnistamaan missä koneoppiminen tuo eniten lisäarvoa, Leppänen kertoo.

Valtteri valikoi oikeusministeriön vaalitulosdatasta annettuun teemaan liittyviä faktoja ja muodostaa niistä tekstikappaleita tutkimusryhmän toimittajataustaisten jäsenten tuottamien lausepohjien avulla.

– Kuten monet ihmisten tekemät asiat, tämä vaikuttaa ensisilmäykseltä suhteellisen yksinkertaiselta. Mutta tietokoneelle tässä on suuri haaste: miten kone tietää mikä on kiinnostavaa tai tärkeää? Botillamme on esimerkiksi Helsingistä yli 2 miljoonaa vaalitulosta koskevaa numeroa, muun muassa puolueiden ja ehdokkaiden kannatusten muutoksia. Ihmisellä on oleellisten asioiden poimintaan valtava määrä hiljaista tietoa. Tietokone taas ei tiedä mitään, mitä emme sille erikseen kerro, Leppänen selostaa.

– Seuraavassa vaiheessa Valtteri tavallaan seuraa ihmisjournalisteja ja pyrkii löytämään juuri tästä ensimmäisestä versiosta puuttuvaa hiljaista tietoa. Tietokone vain on kovin hidas oppija, joten esimerkkejä tarvitaan paljon.

Leppänen korostaa, että kyseessä on kokeilumielessä kehitelty järjestelmä. Myös VTT:n tutkija Magnus Melin on osallistunut Valtterin ohjelmointiprosessiin.

Immersive Automation -projekti kehittää näkemystä uudenlaisesta mediajärjestelmästä, jossa yhdistyvät käyttäjäelämys, automatisoitu kerronta ja läheinen yhteistyö yleisön kanssa. Datasta ja koneoppimisesta ammentava kerronta mahdollistaa nykyistä huomattavasti yksilöllisemmän ja räätälöidymmän käyttäjäkokemuksen, jossa sisällön mukautuminen on keskeinen ominaisuus.

Projektia rahoittavat Tekes, Helsingin yliopisto, VTT, Viestintäalan tutkimussäätiö, Svenska kulturfonden ja mediayritykset.

Lisätietoa Valtterista ja Immersive Automation -projektista antavat

Professori Hannu Toivonen, tietojenkäsittelytieteen laitos, Helsingin yliopisto
+358 50 9 112 405, hannu.toivonen@helsinki.fi

Yliopistotutkija Carl-Gustav Lindén, Svenska social- och kommunalhögskolan, Helsingin yliopisto
+ 358 40 5 157 682, carl-gustav.linden@helsinki.fi

Tutkijaprofessori Caj Södergård, VTT
+358 50 5 539 356, caj.sodergard@vtt.fi