Kielipankissa: Kalle Lahtinen

Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Kalle Lahtinen kertoo meille tutkimuksestaan, jossa hän tarkastelee kielellistä affektia ja puhe-emootiota spontaanin suomen kielen kontekstissa.

Kuka olet?

Olen Kalle Lahtinen ja toimin väitöskirjatutkijana . Ennen jatko-opintojani olen opiskellut tietotekniikkaa, signaalinkäsittelyä, akustiikkaa ja matematiikkaa. Väitöstyötäni ohjaavat professori Okko Räsänen ja vanhempi yliopistonlehtori Liisa Mustanoja Tampereen yliopistosta sekä vanhempi yliopistonlehtori Juraj Šimko Helsingin yliopistosta.

Mikä on tutkimuksesi aihe?

Väitökseni aihe on Kielellinen affekti ihmisen ja koneen tulkitsemana. Tutkin kielellistä affektia ja puhe-emootiota spontaanin suomen kielen kontekstissa. Spontaanilla tarkoitan ei-näyteltyä, ilmaisutyyliltään ohjaamatonta (arki)puhetta. Hyödynnän työssäni sekä puhuttua että kirjoitettua kieltä. Tarkastelen, miten puheen merkityssisältö (mitä sanottiin) ja vastaava akustinen signaali (miten sanottiin) vaihtelevat, liittyvät toisiinsa ja vaikuttavat ilmaisun tulkintaan kokonaisuutena. 

Työssäni tarkastelen suuria kieliaineistoja signaalinkäsittelyn ja koneoppimisen avulla. Väitöstyö tuottaa uusia aineistoja ja menetelmiä kielellisen affektin analyysiin ja mallintamiseen niin, että huomioiduksi tulevat sekä puhekielen yksilöllinen että tilanteellinen vaihtelu. Tulokset vievät sekä kielentutkimusta että puheteknologista sovelluskehitystä eteenpäin.

Työni on osa Tampereen yliopiston poikkitieteellistä -hanketta, jonka rahoittajana toimii Jane ja Aatos Erkon säätiö.

Miten Kielipankki liittyy tutkimukseesi?

Väitöstutkimukseni ensimmäisen vaiheen aikana koostettu spontaanin suomen kielen affektikorpus julkaistaan Kielipankissa. Korpus on koostettu , ja -aineistoista (jotka myös ovat joko jo saatavilla tai tulossa saataville Kielipankkiin). FinnAffect-korpus koostuu 1 474 728:sta 1–20 sekuntia pitkästä litteroidusta puhunnosta, joista 12 000 on annotoitu tunnesävyn ja virittyneisyyden suhteen. Aineistossa on tuhansien erilaisten ihmisten puhetta ja on siten kielellisen affektin tutkimisen suhteen ensimmäinen laatuaan Suomessa. FinnAffect-korpuksen koostamisen ja julkaisemisen mahdollistivat Kielipankkiin jo tallennetut laajat puhutun kielen aineistot sekä tietysti Kielipankin tarjoama asiantunteva palvelu.

Julkaisut

Lahtinen, K., Vaaras, E., Mustanoja, L., Räsänen, O. (2025). . Interspeech 2025, 3958-3962.

Lahtinen, K., Mustanoja, L., Räsänen, O. (2025). Speech Communication 175, 103327–.

Aineistoja

eli suomalaisten yliopistojen, CSC – Tieteen tietotekniikan keskuksen ja Kotimaisten kielten keskuksen muodostama konsortio auttaa ihmistieteiden tutkijoita käyttämään, jalostamaan, säilyttämään ja jakamaan tutkimusaineistoja. Aineistoja ja työkaluja tarjoaa .