Koneoppiminen on päivän sana

Google Researchin päällikkö Corinna Cortes vieraili Helsingin yliopistolla osana Helsinki Distinguished Lecture Series on Future Information Technology -luentosarjaa. Cortesin luento käsitteli tietojenkäsittelyalan kuuminta trendiä, koneoppimista.

Corinna Cortes johtaa New Yorkissa toimivaa tutkimusryhmää, joka vastaa hänen mukaansa pientä tietojenkäsittelytieteen laitosta ja keskittyy koneoppimisen ongelmakenttään. Koneoppiminen on tekoälyn osa-alue, jossa on yksinkertaistettuna kyse siitä, että koneet opetetaan tekemään tylsiä askareita ilman ihmisvalvontaa. Koneoppimista käytetään monella eri alalla kasvojen- ja puheentunnistusohjelmista osakemarkkina-analyyseihin.

Koneoppimista voidaan hyödyntää rajattomasti arjessa

– Periaatteessa koneoppimista voidaan hyödyntää rajattomasti. Esimerkiksi puheentunnistustekniikan kehittäminen saattaa johtaa siihen, että viiden vuoden kuluttua voimme keskustella sujuvasti omilla äidinkielillämme samalla, kun pieni laite kääntää puheemme, Cortes sanoo.

Tietokonepohjaisia käännöstyökaluja käyttäneet tietävät, että koneoppimisen nykysovelluksissa on paljon parantamisen varaa, mutta koneet kehittyvät paremmiksi sitä mukaa kun käytämme niitä. Tutkijoiden on kuitenkin ensin ratkaistava joitain ongelmia.

– Meillä riittää työsarkaa. Esimerkiksi puheentunnistus kärsii liikenteen ja muiden ihmisten äänistä. Koska puhujan ympäristö on harvoin täysin äänetön, tietokoneen on vaikea erottaa varsinainen puhe taustahälystä, Cortes kertoo.

Tietokone häviää edelleen ihmiselle

Puheentunnistus ja konekääntäminen ovat kuitenkin Cortesin mukaan melko helppoja tehtäviä verrattuna visuaaliseen tunnistamiseen. Miten kone voi erottaa koivun vaikkapa pähkinäpuusta?

– Sanavarastomme on rajallinen, mikä rajoittaa myös luokittelutarpeita. Visuaalinen hahmottaminen sen sijaan sisältää miljardeja eri luokkia, jotka on selitettävä tietokoneelle, jotta se pystyy tunnistamaan kohteen, Cortes toteaa.

Kilpailu työpaikoista on nykyään kiivasta. Cortes korostaakin perustutkimuksen merkitystä ja sitä, että perustaidot – kuten algoritmit, tietorakenteet, tilastot, matematiikka ja ohjelmointi – kannattaa opetella jo opiskeluaikana.

– Perustaitojen merkitystä ei voi yliarvioida. Halutut sovellukset voi opetella myöhemminkin, mutta hyvä perusosaaminen avaa paljon enemmän työmahdollisuuksia kuin liiallinen erikoistuminen. Google rekrytoi arviolta 90 prosenttia uusista työntekijöistään perustaitojen perusteella.

Helsinki Distinguished Lecture Series on Future Information Technology -luentosarja on Helsingin yliopiston ja Aalto-yliopiston yhteishanke. Luentosarja esittelee kansainvälisten huippuasiantuntijoiden näkemyksiä tietotekniikan tutkimuksen nykyisistä ja tulevista haasteista ja ratkaisuista.