Janne Leppä-aho väittelee aiheesta Menetelmiä suunnattujen ja suuntaamattomien graafisten mallien oppimiseen

15.1.2020
FM Janne Leppä-aho väittelee perjantaina 24.1.2020 klo 12 aiheesta Menetelmiä suunnattujen ja suuntaamattomien graafisten mallien oppimiseen. Väitöskirjatyö on osa Helsingin yliopiston tietojenkäsittelytieteen osastolla ja Information, Complexity and Learning -ryhmässä tehtävää tutkimusta.

FM Janne Leppä-aho väittelee perjantaina 24.1.2020 klo 12 Helsingin yliopiston Exactum-rakennuksen auditoriossa B123  (Pietari Kalmin katu 5, 1. kerros) aiheesta Methods for Learning Directed and Undirected Graphical Models. Vastaväittäjänä toimii vanhempi tutkija Brandon Malone (NEC Laboratories Europe, Saksa) ja kustoksena professori Teemu Roos (Helsingin yliopisto). Väitöstilaisuus pidetään englanniksi.

Janne Leppä-ahon väitöskirjatyö on osa Helsingin yliopiston tietojenkäsittelytieteen osastolla ja Information, Complexity and Learning -ryhmässä tehtävää tutkimusta. Väitöskirjatyön ohjaajana on toiminut professori Teemu Roos (Helsingin yliopisto).

Menetelmiä suunnattujen ja suuntaamattomien graafisten mallien oppimiseen

Graafiset todennäköisyysmallit ovat yleispätevä tapa mallintaa yhteyksiä usean satunnaismuuttujan välillä. Keskeinen työkalu näissä malleissa on verkko, eli graafi, jolla voidaan visuaalisesti esittää muuttujien välinen riippuvuusrakenne. Tämä väitöskirja käsittelee erilaisia menetelmiä suuntaamattomien ja suunnattujen verkkojen oppimiseen havaitusta aineistosta.  

Liittyen suuntaamattomiin verkkoihin, tässä työssä esitellään kaksi erilaisiin tilanteisiin soveltuvaa menetelmää verkkojen rakenteen oppimiseen. Ensiksi esitellään mallinvalintakriteeri, jolla voidaan oppia verkkojen rakenteita muuttujien ollessa normaalijakautuneita. Kriteeri johdetaan approksimaationa usein laskennallisesti vaativalle bayesiläiselle marginaaliuskottavuudelle (marginal likelihood). Työssä tutkitaan kriteerin teoreettisia ominaisuuksia ja näytetään kokeellisesti, että se toimii hyvin tilanteissa, joissa muuttujien määrä on suuri.  

Toinen esiteltävä menetelmä on ei-parametrinen, tarkoittaen karkeasti, että emme tarvitse tarkkoja oletuksia syötemuuttujien jakaumasta. Menetelmä käyttää hyväkseen aineistosta estimoitavia informaatioteoreettisia suureita sekä permutaatiotestiä. Kokeelliset tulokset osoittavat, että menetelmä toimii hyvin, kun riippuvuudet syöteaineiston muuttujien välillä ovat epälineaarisia.  

Väitöskirjan toinen osa käsittelee Bayes-verkkoja, jotka ovat suunnattuja graafisia malleja. Työssä esitellään uusi mallinvalintakriteeri Bayes-verkkojen oppimiseen diskreeteille muuttujille. Tätä kriteeriä tutkitaan teoreettisesti sekä verrataan kokeellisesti muihin yleisesti käytettyihin mallinvalintakriteereihin.  

Väitöskirjassa esitellään viimeisenä sovellus suunnatuille graafisille malleille johtamalla Bayes-verkkoon pohjautuva Fisher-ydin (Fisher kernel). Saatua Fisher-ydintä voidaan käyttää mittaamaan datavektoreiden samankaltaisuutta ottaen huomioon riippuvuudet vektoreiden komponenttien välillä, mitä havainnollistetaan kokeellisesti.

Väi­tös­kir­jan saa­ta­vuus

Väitöskirjan elektroninen versio on saatavilla Helsingin yliopiston e-thesis-palvelussa osoitteessa http://urn.fi/URN:ISBN:978-951-51-5772-0.

Painettuja väitöskirjoja voi tiedustella väittelijältä itseltään: janne.leppa-aho@helsinki.fi.