Elaine Zosa väittelee aiheesta Uutismedian analysointi aihemalleilla

M.Sc. Elaine Zosa väittelee maanantaina 6.3.2023 aiheesta Uutismedian analysointi aihemalleilla. Väitöskirjatyö on osa Helsingin yliopiston tietojenkäsittelytieteen osastolla ja Discovery Research -ryhmässä tehtävää tutkimusta.

M.Sc. Elaine Zosa puollustaa väitöskirjaansa Analysis of News Media with Topic Models maanantaina 6.3.2023 klo 13 Helsingin yliopiston Kielikeskuksen juhlasalissa (Fabianinkatu 26, 3. kerros). Vastaväittäjänä toimii professori Krista Lagus (Helsingin yliopisto) ja kustoksena professori Hannu Toivonen (Helsingin yliopisto). Väitöstilaisuus pidetään englanniksi. 

Elaine Zosan väitöskirja on osa Helsingin yliopiston tietojenkäsittelytieteen osastolla ja Discovery Research -ryhmässä tehtävää tutkimusta. Väitöskirjan ohjaajina ovat toimineet professori Hannu Toivonen (Helsingin yliopisto) ja Senior AI Scientist Mark Granroth-Wilding (Silo AI).

Uutismedian analysointi aihemalleilla

Päivittäiset uutiset tallentavat yksityiskohtaisia tietoja tapahtumista, asioista ja mielipiteistä ympäri maailman. Tuoreiden uutisten lisäksi monet kansalliskirjastot digitoivat historiallisia sanomalehtiarkistojaan. Runsaat uutisaineistot tarjoavat paljon mahdollisuuksia humanististen ja yhteiskuntatieteiden tutkijoille, mutta aineistojen koko tekee niiden hallinnasta ja tutkimisesta vaikeaa. Siksi tarvitaan laskennallisia menetelmiä, joilla aineistoista tehdään saavutettavampia suuremmalle joukolle käyttäjiä. Aihemallinnus – piilevien teemojen automaattinen tunnistus artikkelikokoelmasta – sopii tehtävään hyvin, koska se tuottaa ymmärrettäviä tuloksia, vaatii vain vähän ohjausta eikä riipu artikkelien kielestä.

Tässä väitöskirjassa kehitetään ja sovelletaan aihemalleja uutiskokoelmien analysoimiseen. Väitöskirja keskittyy uutiskokoelmien kolmeen ominaisuuteen: (1) monikielisyyteen – uutisia julkaistaan eri kielillä ympäri maailmaa, (2) ajallisuuteen – uutisaiheet muuttuvat ajan kuluessa, ja (3) monimuotoisuuteen – uutiset sisältävät tekstien lisäksi kuvia ja muuta informaatiota.

Väitöskirjassa esitetään kaksi uutta aihemallia monikielisten, ajallisten ja monimuotoisten aineistojen analysointiin. Ensimmäinen niistä kuvaa uutisaiheiden muutoksia monikielisissä aineistoissa, toinen puolestaan monikielisiä ja monimuotoisia aineistoja. Väitöskirjassa esitetään myös monikielinen menetelmä aiheiden nimeämiseen kieliriippumattoman uutissanaston avulla.

Väitöskirjassa sovelletaan aihemalleja kahteen historiallisten uutisten analysointiongelmaan. Ensimmäisessä sovelluksessa aihemalleilla seurataan yhteiskunnallisen keskustelun muuttumista historiallisissa sanomalehdissä pitkällä ajanjaksolla. Sovelluksen perusteella aihemallit ovat kohtuullisen luotettavia keskeisten aiheiden tunnistamisessa, mutta ne voivat valitun mallien käyttötavan mukaan myös hämärtää aineiston epäjatkuvuuskohtia. Asiantunteva tulkinta on siksi tärkeää, kun historiallisia keskusteluja analysoidaan aihemallien avulla. Toisessa sovelluksessa testataan, kuinka paperilehtien digitoinnissa syntyvät tekstintunnistusvirheet vaikuttavat aihemallien toimintaan. Tulosten perusteella sanaupotuksia hyödyntävät aihemallit sietävät virheitä hyvin.

Väi­tös­kir­jan saa­ta­vuus

Väitöskirjan elektroninen versio on saatavilla Helsingin yliopiston e-thesis-palvelussa osoitteessa http://urn.fi/URN:ISBN:978-951-51-8842-7.

Painettuja väitöskirjoja voi tiedustella väittelijältä itseltään: elaine.zosa@helsinki.fi.