Det digitala nyhetsögat läser nyheter från det förgångna och förklarar dem för nya läsare

Forskare vid Helsingfors universitet har fått europeisk finansiering på nästan en miljon euro för sitt så kallade NewsEye-projekt som utvecklar en digital forskningsassistent som automatiseras med artificiell intelligens. Assistenten hittar t.ex. kopplingar och olikheter mellan företeelser i historiska tidningar, och kan dessutom förklara dem. Forskningen öppnar ett helt nytt perspektiv till den digitalisering av gamla tidningar som redan har utförts.

NewsEye, ett mångvetenskapligt forskningsprojekt vid Helsingfors universitet, har fått finansiering som kommer att stöda forskare i digital humanism, specialister i datavetenskap och biblioteksvetare i deras arbete med digitaliserat minnesmaterial. De ville idka samarbete för att få brukbara och relevanta resultat för forskningens, undervisningens, och övriga användares behov.

Data science automatiseras med hjälp av artificiell intelligens

Fokus inom forskningen ligger på data science och leds av professor Hannu Toivonen.

– Det mest intressanta utvecklingsobjektet är en automatiserad forskningsassistent, som självständigt använder nya verktyg som projektet utvecklar till att finna resultat som är intressanta för användaren, rapportera om dem i klartext, och som kan förklara resultaten och sitt eget arbete. Det är vad vi siktar på vid Helsingfors universitet nu, säger professor Toivanen, som är känd som en specialist på kreativ datavetenskap.

Tidningar som digitaliserats i St Michels blev big data-material som kan läsas av maskiner

Startpunkten är Nationalbibliotekets material som redan har digitaliserats. Målet är att utvinna text automatiskt från det digitala materialet, göra om bilder till text, samt att igenkänna enskilda artiklar.

Nationalbiblioteket överlåter material från historiska finländska tidningar från åren 1771-1910 till NewsEye-projektet. Det har digitaliserat alla finländska tidningar som utkommit under denna tid och gjort ett datapaket som kan läsas av maskiner. Materialet kommer att kompletteras med tidningar från 1911-1917. Den omfattande digitaliseringen som Nationalbiblioteket utför sker vid dess kontor i St Michels.

Verktyg för analys av berikad text från olika perspektiv

Projektet arbetar också med automatisk berikning av text genom att igenkänna namn och attityder i texter. De finländska forskarna arbetar också med att utveckla nya verktyg för att analysera text från olika perspektiv så att man kan uppmärksamma olika kontexter och jämförelsepunkter.

Hannu Toivonen ger ett exempel på hur den automatiserade forskningsassistenten kunde fungera om kontext och jämförelsepunkt har observerats:

– En användare är intresserad av sin familjehistoria och ger sitt släktnamn för undersökning. Forskningsassistenten söker efter släktnamnet i gamla tidningar och noterar i vilka sammanhang det förekommer. Assistenten observerar att det är fråga om ett släktnamn, jämför dess kontexter med andra namns kontexter, och meddelar användaren vilka kontexter som betonas mest i samband med släktnamnet i fråga. Dessutom kan assistenten rapportera hur kontexterna har förändrats med tiden.

I bästa fall kan projektet behandla flera språk parallellt

Andelen finansiering för Helsingfors universitet är 900.000 euro inom det tvärvetenskapliga H2020-projektet NewsEye: A Digital Investigator for Historical Newspapers. Arbetet har nyligen börjat och fortgår i 3 år. Den europeiska helhetsfinansieringen för projektet är 3 miljoner euro.

Från Helsingfors universitet deltar Hannu Toivonen och historieforskare Mikko Tolonen med forskargrupp, och från Nationalbiblioteket Minna Kaukonen med sin forskningsgrupp. Motsvarande tvärvetenskapliga triader deltar från Frankrike och Italien, och dessutom en partner från Tyskland.

En ny egenskap är flerspråkighet: metoderna och verktygen kommer att göras så oberoende av språk som möjligt, eller i bästa fall sådana att de kan behandla flera språk parallellt. Enligt forskarna är detta viktigt – men ovanligt – i ett europeiskt sammanhang.

Läs mera:
Nationalbiblioteket
Vid Helsingfors universitet är NewsEye en kärnverksamhet inom både HiData och HELDIG, som båda är flervetenskapliga nätverk inom datavetenskap men också humaniora.
HELDIG, Helsinki Centre for Digital Humanities
HiData

Välkommen med!

HiData presenterar sin verksamhet och ordnar en kick off-tillställning tisdagen den 29 maj i Tankehörnan, Tiedekulma, Universitetsgatan 4. Alla är hjärtligt välkomna med!

Kontaktuppgifter
Hannu Toivonen, matematisk-vetenskapliga fakulteten, hannu.toivonen@helsinki.fi, http://www.cs.helsinki.fi/hannu.toivonen/, 050 9112405
Minna Kaukonen, Nationalbiblioteket, minna.kaukonen@helsinki.fi, 050 4155 450
Mikko Tolonen, Nationalbiblioteket, mikko.tolonen@helsinki.fi, 050 448 2055
Kommunikationsexpert Minna Meriläinen-Tenhu, @MinnaMeriTenhu, 050 415 0316, minna.merilainen@helsinki.fi