POC-projekti aloitettiin tammikuussa 2025 valmistelemalla suljettu tietoturvallinen työskentely-ympäristö ja siirtämällä sinne COMPAIR-hankkeessa aiemmin annotoitu aineisto. Alkuun ympäristössä testattiin, kuinka OpenAI:n tekoälypohjainen litterointiin tarkoitettu puheentunnistusmalli WhisperX suoriutuu epätyypillisiä puhujia sisältävän aineiston litteroinnista. Keskeiseksi ongelmaksi muodostui kuitenkin WhisperX:n taipumus poistaa litteraatista puheen sujumattomuudet, jotka ovat tutkimuksessa olennaisia. WhisperX ei myöskään erottele keskustelun eri puhujia. Puheen raakalitteroinnissa se on kuitenkin hyvä ja nopea apuväline.
Puheentunnistusmallit on tyypillisesti kehitetty aineistolle, jossa on yksi puhuja eikä päällekkäispuhuntaa. COMPAIR-hankkeen aineisto on kuitenkin keskusteluaineistoa, jossa vähintään kaksi puhujaa puhuu usein myös päällekkäin. Siksi hankkeessa kartoitettiin mahdollisuutta käyttää puhujanerottelutyökaluja. Tämä osoittautui kuitenkin haastavaksi.
Kesäkuussa tutkimus pyörähti kunnolla käyntiin, kun hankkeessa aloitti neljä tutkimusavustajaa. Korjauksentunnistusmallin pohjaksi valittiin kevään testien perusteella suomenkielisellä puheaineistolla koulutettu wav2vec-puheentunnistusmalli. Korjausanalyysin tarkkuus osoittautui riippuvaksi aineiston laadusta, määrästä ja siinä esiintyvien korjausten piirteistä, mutta tulokset ovat varovaisen lupaavia.
Vaikka annotoitua aineistoa on jo valmiiksi paljon, aineiston lisääminen näyttää edelleen parantavan mallia. Syksyllä hankkeessa aloitettiin lisäaineiston kerääminen kontrolloiduissa ääniolosuhteissa niin, että puhujilla on erilliset mikrofonit, mikä helpottaa puhujien erottelua. Aineiston annotointi on aikaisempiin aineistoihin verrattuna nopeaa, sillä alkuvuoden ajojen perusteella on saatu selkeä käsitys siitä, mitkä piirteet mallin kannalta on tärkeää merkitä.
Korjaustentunnistusmallin ohella hankkeessa on onnistuttu kartoittamaan monia tekoälypohjaisia työkaluja, joita voidaan hyödyntää logopedian tutkimuksessa tulevaisuudessa.