Tjänster som utnyttjar artificiell intelligens (AI) behövs också för små språk – forskarna sätter fart på företagens produktutveckling

Projektet LAREINA, som koordineras av Helsingfors universitet, hjälper företagen att bygga upp talbaserade gränssnitt för språk som inte talas så mycket, såsom finska, samiska och finlandssvenska. Företagen kan dra nytta av arbetets resultat när de beger sig ut på den växande språkteknologiska marknaden.
Detta handlar samarbetet om
  • Målet är att säkerställa att också små språkgrupper erbjuds högklassiga tjänster och produkter som utnyttjar artificiell intelligens och är talbaserade. Sådana skapas inte nödvändigtvis i de stora, globala företagens utvecklingsarbete.
  • I projektet utvecklasmodeller för taligenkänning och talsyntes på finska, samiska och finlandssvenska. Dessa testas till exempel i telefontjänster och vid översättning. I projektet deltar företag, representanter för offentlig förvaltning och samarbetspartner i Norge, Sverige och Estland.
  • Detta resulterar i modeller som kan kommersialiseras och användas som grund när talbaserade gränssnitt utvecklas för olika små språk och dialektområden. Dessa hjälper finländska företag att konkurrera med egna AI-lösningar på den internationella marknaden.

Chat GPT och andra applikationer som utnyttjar artificiell intelligens blir snabbt allt vanligare. De kan utnyttjas i bland annat kundservice, hälso- och sjukvården och som stöd i arbetet inom olika branscher. Vi står dock inför en stor brytningstid: i framtiden kommer vi i allt högre grad att kommunicera muntligt med AI. Detta underlättar användningen av applikationerna i vardagen.

Därför är det viktigt att talbaserade användargränssnitt byggs också för små språk som finska, samiska och finlandssvenska. Detta arbetar Helsingfors universitet och Aalto-universitet för tillsammans med sina samarbetspartner i projektet LAREINA som beviljats finansiering av Business Finland för perioden 2023–2025.

Forskarna skapar modeller som kan dupliceras och med vars hjälp företagen kan utveckla talbaserade applikationer som utnyttjar artificiell intelligens. Detta öppnar dörrar till global export – till exempel marknaden för taligenkänning förväntas växa med hela 19 procent under de närmaste åren. Med modellernas hjälp går det att skapa talbaserade användargränssnitt för små språk ute i världen och även för de stora exportländernas behov.

– Det finns många olika dialekter på de stora språkområdena. Produkter som utnyttjar artificiell intelligens måste åtminstone kunna förstå dessa, även om de kanske svarar på majoritetsspråket, berättar forskningsdirektör Krister Lindén vid avdelningen för digital humaniora.

Ska underlätta läkarnas vardag och tolkning av möten

LAREINA är kopplat till programvaruföretaget Tietoevrys Veturi-projekt, som bland annat kartlägger vilka möjligheter artificiell intelligens kan erbjuda hälso- och sjukvården. Artificiell intelligens som förstår talat språk kan underlätta läkarens arbete genom att göra ett sammandrag av diskussionen med klienten.

– Då blir det mycket mer tid över till att ta emot patienter, säger Lindén.

Artificiell intelligens kan också erbjuda tolkningshjälp under möten, sköta tidskrävande transkriberingsuppgifter på olika arbetsplatser och betjäna kunder i en telefonväxel. Under projektets lopp testas applikationerna vid såväl företag som i den offentliga sektorn.

Aalto-universitetet ansvarar för taligenkänningen och språkmodellerna, medan Helsingfors universitet koordinerar projektet och bidrar med sin kunskap inom talsyntes. Det behövs för att den artificiella intelligensen ska kunna prata med sina användare. Målet är att lära den artificiella intelligensen prata med hjälp av ett så litet material som möjligt och skapa ett slutresultat som låter naturligt.

– Man kan betona vad som är viktigt i en mening med olika metoder och genom att placera pauser på lämpliga ställen.

AI utbildas med talbaserade data från Nationella audiovisuella institutet  och de nordiska rundradiobolagen. Den första finskspråkiga versionen av taligenkänning och talsyntes är redan färdig. Under åren 2024–2025 kommer finlandssvenskan och samiskan att stå i centrum.

Målet är att skapa ett talbaserat användargränssnitt med hjälp av ett så litet material som möjligt. Det finns olika metoder för att göra det. Man kan bland annat samla in data från besläktade språk och göra finputsningen på målspråket.

Krister Lindén, forskningsdirektör

 

Företaget vill säkerställa att applikationerna ger mervärde

Språkmodellerna som utarbetas i projektet ska bli tillgängliga för alla med en licens som möjliggör kommersiell användning. De publiceras i AI-communityn Hugging Face och i Språkbanken, där man också samlar data med tanke på fortsatt arbete. Öppen publicering är viktigt för samarbetspartnern Tietoevry, eftersom resultaten därmed enkelt kan delas med olika landsorganisationer och kunder.

– Detta betjänar också samhället, eftersom projektet är finansierat med offentliga medel, konstaterar chefen för bolagets forsknings- och utvecklingsfunktioner Iftikhar Ahmad.

Tietoevry vill säkerställa att deras AI-applikation ger ett mervärde och att företaget utökar sådan kunskap som är viktig för dess verksamhet. Här är universitetssamarbetet till stor nytta. Enligt Ahmad skulle projektet rentav kunna utvecklas till en nordisk artificiell intelligenslösning i stil med Whisper.

Ekosystemen och infrastrukturerna som byggs i LAREINA stöder också finländarnas deltagande i EU-projekt. Enligt Ahmad skulle det vara viktigt att inbringa mer europeisk finansiering eftersom det skulle utöka sådana nätverk som främjar export och tillväxt. 

– Detta är en enorm möjlighet för finländska forskare och företag.

Talteknologins potential intresserar också Folkpensionsanstalten. Fpa testar tillsammans med universiteten om den artificiella intelligensen skulle kunna användas för att transkribera kundsamtal eller till att sammanställa kömeddelanden till telefontjänsten. Utvecklingsdirektör Riikka Lindroos-Järvitalo anser att samarbetet hjälper att visa hur funktionella lösningarna är och erbjuder stöd också när nya teknologier börjar användas.

– Vi har stora förväntningar på och önskemål för detta projekt. Det är fantastiskt att få vara med.

”När språkmodellerna blir tillgängliga i Hugging Face kan hela Tietoevrys världsomfattande koncern utnyttja dem.”
Är du intresserad av samarbete med Helsingfors universitet?

Ta kontakt så planerar vi ett projekt enligt dina individuella behov: business@helsinki.fi

Samarbetet i ett nötskal

LAREINA finansieras av Business Finland och är ett forskningsprojekt kopplat till Tietoevrys Veturi-program under perioden 2023–2025. Det genomförs av Helsingfors universitet och Aalto-universitetet. Övriga samarbetspartner är Tietoevry Oy, Lingsoft Oy, Kielikone Oy, Inscripta Oy, KAVI, Fpa och Solita Oy. Talbaserat material för att utbilda den artificiella intelligensen samlas bland annat in från de nordiska rundradiobolagen. Samarbete bedrivs också med Sametinget samt universitet i Norge, Sverige och Estland. Målet är att hjälpa företagen att utveckla talbaserade gränssnitt till AI-applikationer för små språk och att nå ut på den globala marknaden. Mer information här. 

 

Tilläggsuppgifter om samarbetet:

  • Krister Lindén, forskningsdirektör, Helsingfors universitet, avdelningen för digital humaniora 
  • Iftikhar Ahmad, chef för forsknings- och utvecklingsfunktionerna, Tietoevry Oy