Läkaren är kidsens kompis – donera prat du med så förstår artificiell intelligens snart också dialekter

Yle har sedan juni synligt marknadsfört projektet Lahjoita puhetta – Donera prat – i sina kanaler. Också Helsingfors universitet medverkar i projektet.

Samarbetsprojektet med Helsingfors universitet syftar till att samla in 10 000 timmar naturligt, aktuellt och mångsidigt talmaterial i Språkbanken, som kan användas lagligt och säkert för såväl forskning som i företag för utveckling av teknik och finskspråkig artificiell intelligens. Talmaterial samlas in för olika finska dialekter, och artificiell intelligens utvecklas för att känna igen vardagligt tal, inklusive dialektord och knaggligt prat. Även statens utvecklingsbolag medverkar i projektet.

Hittills har drygt 2 600 timmar tal på olika dialekter samlats in. Forskningsdirektör Krister Lindén vid Avdelningen för digital humaniora och FIN-CLARIN berättar att de till en början trodde att enbart unga män skulle fatta intresse och ladda ner appen för att donera prat eller delta på kampanjwebbplatsen, men 60 procent av deltagarna har faktiskt varit kvinnor. Åldersfördelningen är heterogen och folk i alla åldrar deltar. Målet är att få artificiell intelligens att känna igen dialekter och såväl innehåll som sätt att tala hos människor i olika åldrar.

Internationellt betydande projekt

Projektet med insamling av tal är ett internationellt sett unikt projekt. Dataskyddet har säkerställts så att folk anonymt kan donera vanligt, vardagligt tal. De som donerar vet vilket syfte talet doneras för, och företagen som utvecklar den artificiella intelligensen får ingen annan information om dem än just pratet. Projektet stärker samarbetet mellan företagen och de humanistiska vetenskaperna vid Helsingfors universitet.

Syftet med projektet är att tjänster ska kunna göras tillgängliga i hela Finland. Det observerades att det saknas verktyg för att utveckla artificiell intelligens som når alla.

– Artificiell intelligens måste utvecklas så att den förstår vanligt talspråk överallt i Finland, inte enbart skriftspråket, konstaterar Lindén. 

– Det finns också ett socialt tryck på att utveckla artificiell intelligens, konstaterar Mietta Lennes, projektplanerare vid Språkbanken.

– Med artificiell intelligens går det att ta fram individanpassade tjänster som också beaktar dem som behöver särskilt stöd. 

Till exempel måste en vårdrobot bokstavligen kunna förstå patienten. Av tonfallet kan roboten höra vilket humör patienten är på. Artificiell intelligens måste även utvecklas för att förstå invandrares kanske ännu knackiga finska. Tjänsten måste vara pålitlig, så att kunden vågar tala till maskinen och blir förstådd. 

Självbetjäning för stora grupper och tjänsteprogram för specialgrupper förutsätter att användargränssnitten fungerar pålitligt med text och tal, på användarens eget modersmål. Med kampanjen Lahjoita puhetta tas aktuellt tal- och språktekniskt stöd fram för att kunna användas av alla, och till exempel utvecklas talstyrda program och tjänster som fungerar smidigt. 

Stor synlighet genom samarbetet med Yle

Samarbetspartnern Yle följer volymen insamlat material och intensifierar kampanjen i landskap där taldonationerna verkar tappa fart.  Även de olika åldersgruppernas andel observeras.

– I somras talades det naturligt nog mycket om corona, men också om till exempel djur och sport. Det finns många teman som man kan prata om i projektet, berättar Lennes, och fler läggs till under hösten.        

Donera du också – oavsett om du studerar eller arbetar vid universitetet, hunnit bli alumn eller är en samarbetspartner. Talet doneras till forskarna anonymt, gratis och med dataskydd.

Samarbetspartner för projektet Lahjoita puhetta

Kampanjen genomförs i samarbete mellan Yle, Statens utvecklingsbolag och Helsingfors universitet. I insamlingsprojektet deltar dessutom FIN-CLARIN, som är ett gemensamt konsortium för de finländska universiteten, CSC och Institutet för de inhemska språken. Det hjälper forskare inom humaniora bland annat att utnyttja och vidareförädla forskningsdata. Konsortiets servicehelhet Språkbanken  tillhandahåller material och verktyg för forskning. Helsingfors universitet ansvarar för korpusar, verktyg och utbildning. CSC ansvarar för teknisk administration av webbplatsen. Också experter från Aalto-universitetet och Åbo universitet har medverkat.