NewsEye, ett mångvetenskapligt forskningsprojekt vid Helsingfors universitet, har fått finansiering som kommer att stöda forskare i digital humanism, specialister i datavetenskap och biblioteksvetare i deras arbete med digitaliserat minnesmaterial. De ville idka samarbete för att få brukbara och relevanta resultat för forskningens, undervisningens, och övriga användares behov.
Data science automatiseras med hjälp av artificiell intelligens
Fokus inom forskningen ligger på data science och leds av professor Hannu Toivonen.
– Det mest intressanta utvecklingsobjektet är en automatiserad forskningsassistent, som självständigt använder nya verktyg som projektet utvecklar till att finna resultat som är intressanta för användaren, rapportera om dem i klartext, och som kan förklara resultaten och sitt eget arbete. Det är vad vi siktar på vid Helsingfors universitet nu, säger professor Toivanen, som är känd som en specialist på kreativ datavetenskap.
Tidningar som digitaliserats i St Michels blev big data-material som kan läsas av maskiner
Startpunkten är Nationalbibliotekets material som redan har digitaliserats. Målet är att utvinna text automatiskt från det digitala materialet, göra om bilder till text, samt att igenkänna enskilda artiklar.
Nationalbiblioteket överlåter material från historiska finländska tidningar från åren 1771-1910 till NewsEye-projektet. Det har digitaliserat alla finländska tidningar som utkommit under denna tid och gjort ett datapaket som kan läsas av maskiner. Materialet kommer att kompletteras med tidningar från 1911-1917. Den omfattande digitaliseringen som Nationalbiblioteket utför sker vid dess kontor i St Michels.
Verktyg för analys av berikad text från olika perspektiv
Projektet arbetar också med automatisk berikning av text genom att igenkänna namn och attityder i texter. De finländska forskarna arbetar också med att utveckla nya verktyg för att analysera text från olika perspektiv så att man kan uppmärksamma olika kontexter och jämförelsepunkter.
Hannu Toivonen ger ett exempel på hur den automatiserade forskningsassistenten kunde fungera om kontext och jämförelsepunkt har observerats:
– En användare är intresserad av sin familjehistoria och ger sitt släktnamn för undersökning. Forskningsassistenten söker efter släktnamnet i gamla tidningar och noterar i vilka sammanhang det förekommer. Assistenten observerar att det är fråga om ett släktnamn, jämför dess kontexter med andra namns kontexter, och meddelar användaren vilka kontexter som betonas mest i samband med släktnamnet i fråga. Dessutom kan assistenten rapportera hur kontexterna har förändrats med tiden.
I bästa fall kan projektet behandla flera språk parallellt
Andelen finansiering för Helsingfors universitet är 900.000 euro inom det tvärvetenskapliga H2020-projektet NewsEye: A Digital Investigator for Historical Newspapers. Arbetet har nyligen börjat och fortgår i 3 år. Den europeiska helhetsfinansieringen för projektet är 3 miljoner euro.
Från Helsingfors universitet deltar Hannu Toivonen och historieforskare Mikko Tolonen med forskargrupp, och från Nationalbiblioteket Minna Kaukonen med sin forskningsgrupp. Motsvarande tvärvetenskapliga triader deltar från Frankrike och Italien, och dessutom en partner från Tyskland.
En ny egenskap är flerspråkighet: metoderna och verktygen kommer att göras så oberoende av språk som möjligt, eller i bästa fall sådana att de kan behandla flera språk parallellt. Enligt forskarna är detta viktigt – men ovanligt – i ett europeiskt sammanhang.
Läs mera:
Nationalbiblioteket
Vid Helsingfors universitet är NewsEye en kärnverksamhet inom både HiData och HELDIG, som båda är flervetenskapliga nätverk inom datavetenskap men också humaniora.
HELDIG, Helsinki Centre for Digital Humanities
HiData
Välkommen med!
HiData presenterar sin verksamhet och ordnar en kick off-tillställning tisdagen den 29 maj i Tankehörnan, Tiedekulma, Universitetsgatan 4. Alla är hjärtligt välkomna med!
Kontaktuppgifter
Hannu Toivonen, matematisk-vetenskapliga fakulteten, hannu.toivonen@helsinki.fi, http://www.cs.helsinki.fi/hannu.toivonen/, 050 9112405
Minna Kaukonen, Nationalbiblioteket, minna.kaukonen@helsinki.fi, 050 4155 450
Mikko Tolonen, Nationalbiblioteket, mikko.tolonen@helsinki.fi, 050 448 2055
Kommunikationsexpert Minna Meriläinen-Tenhu, @MinnaMeriTenhu, 050 415 0316, minna.merilainen@helsinki.fi