Lekuri on skidien gaiffari – lahjoita sinäkin puhetta ja tekoäly ymmärtää pian myös murteita

YLE on kesäkuusta alkaen markkinoinut kanavillaan näkyvästi Lahjoita puhetta -hanketta. Mukana hankkeessa on myös Helsingin yliopisto.

Yhteistyöhankkeessa Helsingin yliopiston kanssa on tarkoitus kerätä 10 000 tuntia luonnollista, ajantasaista ja monipuolista puheaineistoa Kielipankkiin, jota voidaan luvallisesti ja turvallisesti hyödyntää sekä tutkimukseen että yrityksissä teknologian ja suomenkielisen tekoälyn kehittämiseen. Puheaineistoa kerätään suomen kielen eri murteilla, ja kehitetään tekoälyä tunnistamaan arkipuhe, murteineen ja takelteluineen. Mukana hankkeessa on myös Valtion kehitysyhtiö.

Puhetta eri murteilla on tähän mennessä kertynyt reilut 2600 tuntia. Tutkimusjohtaja Krister Lindén digitaalisten ihmistieteiden osastolta ja FIN-CLARINista  kertoo, että aluksi luultiin vain nuorten miesten innostuvan ja lataavan itselleen Lahjoita puhetta -sovellus tai osallistuvan kampanjaan hankkeen verkkosivuilla, mutta 60 prosenttia osallistujista onkin ollut naisia. Ikäjakauma on heterogeeninen, mukana on kaikenikäisiä. Tarkoitus on, että tekoäly tunnistaa murteet ja eri-ikäisten ihmisten puheen ja puhetyylin.

Kansainvälisesti merkittävä hanke

Lahjoita puhetta on kansainvälisesti ainutlaatuinen hanke, joka on tietosuojattu ja jossa ihmiset voivat anonyymisti lahjoittaa tavallista arkipuhettaan. Lahjoittajat tietävät mihin tarkoitukseen puhettaan lahjoittavat, eivätkä tekoälyä kehittävät yritykset saa heistä muuta tietoa kuin puhetta. Hanke vahvistaa Helsingin yliopiston humanististen tieteiden ja yritysten yhteistyötä.

Hankkeen tavoitteena on palvelujen saavutettavuus koko Suomessa. Huomattiin, että suomeksi puuttuu työkaluja tekoälyn kehittämiseksi ja kaikkien saataville.

– Tekoälyä on kehitettävä niin, että se ymmärtää tavallista puhekieltä kaikkialla Suomessa, ei vain kirjakieltä, Lindén toteaa. 

– Tekoälyn kehittämiseen on myös sosiaalisia paineita, toteaa Kielipankin projektisuunnittelija Mietta Lennes.

– Tekoälyn avulla on mahdollista tuottaa yksilöllisiä palveluita, jotka huomioivat myös erityistä tukea tarvitsevia ihmisiä.  

Esimerkiksi hoivarobotin on ymmärrettävä potilaan puhetta, kirjaimellisesti. Äänensävystä robotti kuulee, millä tuulella potilas on. Tekoälyä on kehitettävä myös ymmärtämään maahanmuuttajien ehkä vielä puutteellista suomea. Palvelun on oltava luotettavaa, niin että asiakas uskaltaa puhua koneelle ja tulee ymmärretyksi. 

Suurten joukkojen itsepalvelu ja erityisryhmien palvelusovellukset edellyttävät, että käyttöliittymät toimivat luotettavasti tekstin ja puheen avulla, käyttäjän omalla äidinkielellä. Lahjoita puhetta -kampanjan avulla luodaan ajantasainen puhe- ja kieliteknologinen tuki kaikkien käyttöön ja kehitetään esimerkiksi puheella ohjattavia sovelluksia ja palveluja, jotka toimivat sujuvasti.  

Yhteistyössä YLEn kanssa laaja näkyvyys

Yhteistyökumppani YLE seuraa minkä verran aineistoa kertyy ja vahvistaa sitä mukaa kampanjaa maakunnissa, joissa puheen lahjoittaminen näyttäisi hidastuvan.  Myös eri ikäryhmien osuutta seurataan.

–Kesällä puhuttiin paljon luonnollisesti koronasta mutta myös esimerkiksi eläimistä ja urheilusta. Hankkeessa on useita teemoja, joista voi puhua, Lennes kertoo. Teemoja on juuri lisätty.         

Lahjoita sinäkin puhetta, yliopistolainen, alumni ja yhteistyökumppani, tutkijoiden käyttöön, anonyymisti, ilmaiseksi ja tietosuojatusti.