Valtteri-botti tuottaa itsenäisesti vaaliuutisia eri kielillä

Poikkitieteellinen tutkimuskonsortio Immersive Automation on alkuvuodesta valmistellut vaalibottia, joka kirjoittaa itsenäisesti uutisia sunnuntain kuntavaalituloksista.

Valtteriksi kutsuttu botti () on ryhmän ensimmäinen yhteinen tuotos, jonka tulosten perusteella tutkimusryhmä jatkaa työtään uutisautomaation saralla. Botti tuottaa tekstiä suomeksi, ruotsiksi ja englanniksi kaikista Suomen kunnista.

Kieliteknologiaan erikoistunut data-analyytikko Helsingin yliopiston tietojenkäsittelytieteen laitokselta on kehittänyt uutisgeneraattoria viime viikkojen ajan.

– Generaattorin ensimmäinen versio on tehty pitkälti käsin. Kokemusten perusteella pyrimme sitten tunnistamaan missä koneoppiminen tuo eniten lisäarvoa, Leppänen kertoo.

Valtteri valikoi oikeusministeriön vaalitulosdatasta annettuun teemaan liittyviä faktoja ja muodostaa niistä tekstikappaleita tutkimusryhmän toimittajataustaisten jäsenten tuottamien lausepohjien avulla.

– Kuten monet ihmisten tekemät asiat, tämä vaikuttaa ensisilmäykseltä suhteellisen yksinkertaiselta. Mutta tietokoneelle tässä on suuri haaste: miten kone tietää mikä on kiinnostavaa tai tärkeää? Botillamme on esimerkiksi Helsingistä yli 2 miljoonaa vaalitulosta koskevaa numeroa, muun muassa puolueiden ja ehdokkaiden kannatusten muutoksia. Ihmisellä on oleellisten asioiden poimintaan valtava määrä hiljaista tietoa. Tietokone taas ei tiedä mitään, mitä emme sille erikseen kerro, Leppänen selostaa.

– Seuraavassa vaiheessa Valtteri tavallaan seuraa ihmisjournalisteja ja pyrkii löytämään juuri tästä ensimmäisestä versiosta puuttuvaa hiljaista tietoa. Tietokone vain on kovin hidas oppija, joten esimerkkejä tarvitaan paljon.

Leppänen korostaa, että kyseessä on kokeilumielessä kehitelty järjestelmä. Myös :n tutkija Magnus Melin on osallistunut Valtterin ohjelmointiprosessiin.

-projekti kehittää näkemystä uudenlaisesta mediajärjestelmästä, jossa yhdistyvät käyttäjäelämys, automatisoitu kerronta ja läheinen yhteistyö yleisön kanssa. Datasta ja koneoppimisesta ammentava kerronta mahdollistaa nykyistä huomattavasti yksilöllisemmän ja räätälöidymmän käyttäjäkokemuksen, jossa sisällön mukautuminen on keskeinen ominaisuus.

Projektia rahoittavat Helsingin yliopisto, VTT, , ja mediayritykset.

Lisätietoa Valtterista ja -projektista antavat

Professori Hannu Toivonen, tietojenkäsittelytieteen laitos, Helsingin yliopisto

+358 50 9 112 405

Yliopistotutkija Carl-Gustav Lindén, Svenska social- och kommunalhögskolan, Helsingin yliopisto

+ 358 40 5 157 682

Tutkijaprofessori Caj Södergård, VTT

+358 50 5 539 356