Resultaten som Valtteri åstadkommer ska hjälpa forskarna vidareutveckla mer sofistikerade system inom nyhetsautomation. Valtteri finns tillgänglig på adressen vaalibotti.fi och skriver om resultaten i alla kommuner i Finland på finska, svenska och engelska.
Dataanalytikern Leo Leppänen på institutionen för datavetenskap vid Helsingfors universitet är specialiserad på språkteknologi och har haft som sin huvudsakliga uppgift att utveckla nyhetsboten under de senaste veckorna.
– Avsikten är att i detta första steg ta fram ett så kallat mekaniskt system utan inlärning och sedan utgående från resultaten identifiera på vilka punkter maskininlärning kunde medföra det största tilläggsvärdet, säger Leppänen.
Utifrån Justitieministeriets öppna data hämtar Valtteri in fakta och formar informationen till textstycken med hjälp av textmodeller som forskningsgruppens journalistikforskare utarbetat.
– Precis som de flesta saker som människan gör förefaller det här vara väldigt enkelt. Men för en dator innebär det en stor utmaning: hur ska maskinen veta vad som egentligen är viktigt eller intressant? Boten hanterar exempelvis 2 miljoner siffror endast från Helsingfors. Människan har en massa kunskap som vi kanske inte ens är medvetna om. Datorn i sin tur vet ingenting, förutom det som vi berättat för den, säger Leppänen.
– I det följande skedet ska Valtteri så att säga följa med människojournalister och leta fram denna kunskap som saknats i den första versionen. Datorn är dock rätt långsam på att lära sig och därför behöver vi rikligt med exempel.
Leppänen understryker att det är frågan om ett väldigt enkelt system som enbart utvecklats i experimentellt syfte. Forskaren Magnus Melin på Teknologiska forskningscentralen VTT har också deltagit i programmeringen av Valtteri.
Målet med det tvärvetenskapliga forskningsprojektet Immersive Automation är att demonstrera ett framtida mediesystem som bygger på automatiserat berättande, intensivt läsarengagemang och användarupplevelser. Journalistiskt innehåll som utnyttjar data och maskininlärning har en potential att skapa betydligt personligare och mer skräddarsydda läsarupplevelser där lokalt innehåll är en grundläggande egenskap.
Projektet finansieras av Tekes, Helsingfors universitet, VTT, Mediebranschens forskningsstiftelse, Svenska kulturfonden och företag i mediebranschen.
För ytterligare information om Valtteri och projektet Immersive Automation
Universitetsforskare Carl-Gustav Lindén, Svenska social- och kommunalhögskolan vid Helsingfors universitet
+ 358 40 5 157 682, carl-gustav.linden@helsinki.fi
Forskarprofessor Caj Södergård, VTT
+358 50 5 539 356, caj.sodergard@vtt.fi