Otto Nyberg väittelee aiheesta Yksilötason kausaalisuhteiden tunnistaminen klikkidatasta

DI Otto Nyberg väittelee perjantaina 29.9.2023 aiheesta Yksilötason kausaalisuhteiden tunnistaminen klikkidatasta. Väitöskirjatyö on osa Helsingin yliopiston tietojenkäsittelytieteen osastolla ja Multi-Source Probabilistic Intelligence -ryhmässä tehtävää tutkimusta.

DI Otto Nyberg puollustaa väitöskirjaansa "Uplift Modeling with Click-Stream Data" perjantaina 29.9.2023 klo 13 Helsingin yliopiston Kielikeskuksen juhlasalissa (Fabianinkatu 26, 3. krs). Vastaväittäjänä toimii professori Szymon Jaroszewicz (Polska Akademia Nauk, Puola) ja kustoksena apulaisprofessori Arto Klami (Helsingin yliopisto). Väitöstilaisuus pidetään englanniksi.

Otto Nybergin väitöskirja on osa Helsingin yliopiston tietojenkäsittelytieteen osastolla ja Multi-Source Probabilistic Intelligence -ryhmässä tehtävää tutkimusta. Väitöskirjan ohjaajana on toiminut apulaisprofessori Arto Klami (Helsingin yliopisto).

Yksilötason kausaalisuhteiden tunnistaminen klikkidatasta

Oletko koskaan miettinyt, miten mainoksia kohdennetaan verkkokaupoissa tai sosiaalisessa mediassa? Tai mitä yhteistä mainosten kohdentamisella on lääkkeiden valinnan kanssa?

Kaikissa tapauksissa tavoitellaan kausaalista vaikutusta, eli pyritään löytämään mainos tai lääke, joka vaikuttaa yksilöön parhaiten. Matemaattisesta näkökulmasta ongelmat ovat lähes identtisiä, ja niitä lähestytään samoilla laskennallisilla menetelmillä. Perinteisesti vaikutuksia on mallinnettu väestötasolla, jolloin on selvitetty, mikä mainos tai lääke keskimäärin tuottaa parhaan tuloksen, kun kaikille tarjotaan samaa. Nykyisillä menetelmillä päästään lähemmäs yksilötasoa huomioimalla tietoja yksilöstä. Verkkomaailmassa tätä kutsutaan kohdentamiseksi, kun taas lääketieteessä tästä puhutaan yksilöllistettynä lääketieteenä.

Tässä väitöskirjassa käsitellään menetelmiä, joilla voi mallintaa eri toimenpiteiden vaikutuksia yksilötasolla. Keskitymme syy-seuraussuhteisiin, eli kausaliteettiin, ja kausaalisuhteiden mallintamiseen datasta. Olemme tehneet laajasti kokeita verkossa kerätyllä datalla, ja käsitelleet siihen liittyviä ongelmia. Verkossa kerätyssä datassa on tyypillistä, että merkittävän suuri osa kävijöistä eivät esim. osta tuotteita, tai eivät klikkaa mainoksia. Kun tällaisesta datasta halutaan mallintaa ostokäyttäytymistä, aiheuttaa tämä epätasapaino tiettyjä ongelmia. Tämä on tunnettu ongelma ja siihen on valmiita ratkaisuja.

Kun halutaan mallintaa kausaalisuhteita yksilötasolla (engl. "uplift modeling"), niin ongelman luonne muuttuu olennaisesti, eivätkä olemassaolevat ratkaisut sovellu ongelman korjaamiseen. Tässä väitöskirjassa on esitetty ensimmäiset menetelmät tämän epätasapainon aiheuttamien ongelmien korjaamiseksi tässä yhteydessä. Tällaiset kausaaliset laskennalliset menetelmät eivät toistaiseksi ole laajasti käytössä lääketieteessä. Jotta käyttö laajenisi, tarvitsemme ennusteille laatutakeet. Tämän takia olemme julkaisseet kaksi uutta menetelmää yksilötason kausaalisuhteiden mallintamiseen, jotka ennustavat myös epävarmuuksia. Nämä perustuvat kahteen suosittuun mallinnusperheen algoritmeihin, ja toivomme, että tämä työ edistää näiden käyttöä myös muilla aloilla.

Väi­tös­kir­jan saa­ta­vuus

Väitöskirjan elektroninen versio tulee olemaan saatavilla Helsingin yliopiston e-thesis-palvelussa osoitteessa http://urn.fi/URN:ISBN:978-951-51-9440-4.

Painettuja väitöskirjoja voi tiedustella väittelijältä itseltään: otto.nyberg@helsinki.fi.