Chen He väittelee aiheesta Entiteettipohjainen tietämyksen etsintä visuaalisessa datan tutkimisessa

M.Sc. Chen He väittelee torstaina 27.1.2022 aiheesta Entiteettipohjainen tietämyksen etsintä visuaalisessa datan tutkimisessa. Väitöskirjatyö on osa Helsingin yliopiston tietojenkäsittelytieteen osastolla ja Ubiquitous Interaction -ryhmässä tehtävää tutkimusta.

M.Sc. Chen He väittelee torstaina 27.1.2022 klo 16 Helsingin yliopiston Porthania-rakennuksen salissa PIII (Yliopistonkatu 3, 1. krs) aiheesta Entiteettipohjainen tietämyksen etsintä visuaalisessa datan tutkimisessa. Vastaväittäjänä toimii apulaisprofessori T.J. Jankun-Kelly (Mississippi State University, Yhdysvallat) ja kustoksena professori Giulio Jacucci (Helsingin yliopisto). Väitöstilaisuus pidetään englanniksi. Väitöstilaisuutta voi seurata suorana verkkolähetyksenä osoitteessa https://helsinki.zoom.us/j/69181597081.

Chen Hen väitöskirja on osa Helsingin yliopiston tietojenkäsittelytieteen osastolla ja Ubiquitous Interaction -ryhmässä tehtävää tutkimusta. Väitöskirjatyön ohjaajana on toiminut professori Giulio Jacucci (Helsingin yliopisto).

Entiteettipohjainen tietämyksen etsintä visuaalisessa datan tutkimisessa

Visuaalinen datan tutkiminen antaa ihmiselle mahdollisuuden löytää uutta tietämystä datasta vuorovaikutuksessa tästä datasta tehtyjen visuaalisten kuvausten kanssa. Vaikka visuaalista datan tutkimista tukemaan on ehdotettu erilaisia visualisoinnin suunnittelumalleja ja arviointimenetelmiä, alan yhteisöltä puuttuu silti ymmärrystä siitä, kuinka visualisointiin liittyvää vuorovaikutusta pitäisi suunnitella ja kuinka käyttäjät voivat suodattaa uutta tietämystä olemalla vuorovaikutuksessa datan kanssa. Tässä työssä pyritään vastaamaan näihin kahteen haasteeseen.

Kirjallisuuden mukaan olemassa olevien visualisoinnin suunnittelumenetelmien soveltamista vuorovaikutuksen suunnitteluun estää niiden toimivuuden puute. Tähän haasteeseen vastaamiseksi tässä työssä ehdotetaan korkeamman tason vuorovaikutustavoitteiden saavuttamiseksi lähestymistapaa, jossa data abstrahoidaan kokonaisuuksiksi eli entiteeteiksi ja jossa vuorovaikutus suunnitellaan sitten näihin entiteetteihin pohjautuen. Tämän lähestymistavan soveltuvuutta käytäntöön esitellään kolmen eri tapaustutkimuksen kautta. Nämä kolme tapaustutkimusta liittyvät erilaisiin tietoluokkiin liittyvän vuorovaikutuksen hyödyntämiseen sujuvassa tutkivassa tiedonhaussa, lääkkeiden ja niiden vaikutuskohteiden välisiin suhteisiin kohdistuvan vuorovaikutuksen hyödyntämiseen tietämyksen etsimisessä ja jakamisessa sekä visuaalisiin komponentteihin liittyvien viitteiden hyödyntämiseen tietämyksen ulkoistamisen tukemisessa. Tapaustutkimukset osoittavat, kuinka lähestymistavassa voidaan hyödyntää aiemmasta tutkimuksesta johdettuja suunnitteluvaatimuksia ja täyttää erilaiset tehtävätavoitteet noudattamalla visualisoinnin suunnittelun sisäkkäismallia ja tuloksena syntyneiden suunnitelmien siirrettävyyttä muihin datajoukkoihin. Näiden tapaustutkimusten pohjalta esitämme suunnitteluohjeita, jotka auttavat parantamaan entiteettipohjaista vuorovaikutuksen suunnittelua.

Jotta voisimme ymmärtää tietämyksen luontiprosessia visuaalisen datan tutkimisessa, esittelemme kaksi käyttäjätutkimusta, joissa käyttäjiä pyydettiin käyttämään annettua visualisointityökalua ja tekemään muistiinpanoja löytämästään tietämyksestä. Käyttäjien toiminnot talletettiin, ja heidän keräämäänsä tietämystä kuvailtiin korrelaatio- ja ennusteanalyysiä varten. Ensimmäisen tutkimuksen korrelaatioanalyysi osoitti, että käyttäjien tutkimistoiminnot liittyivät useimmiten odottamattoman tietämyksen löytämiseen; porautuva vuorovaikutustapa saattoi johtaa korkeamman tason tietämyksen löytämiseen. Sen lisäksi, että käyttäjiä pyydettiin tekemään muistiinpanoja löydetystä tietämyksestä, toisessa tutkimuksessa käyttäjät pystyivät myös viittaamaan asiaankuuluviin entiteetteihin (visualisointikomponentteihin ja aiempiin muistiinpanoihin) ja näin helpottamaan toiminnastaan kertomista. Tulokset osoittivat, että entiteettiviittaukset johtivat parempiin ennustuksiin kuin vuorovaikutus, joka liittyi pelkästään tietämyksen ominaisuuksiin (luokka, yleiskuva vs. yksityiskohdat sekä aiemman tietämyksen käyttö). Työssä pohditaan myös tutkimusten rajoituksia sekä tutkimustulosten vaikutusta tietämykseen pohjautuvaan visualisointiin, kuten esimerkiksi tietämyssuositusten tukemiseen. 

Tulevaisuudessa käyttäjien muistiinpanojen muokkaaminen entiteettien pohjalta voisi tehdä tietämyksestä koneluettavaa ja edistää näin monipuolista datan tutkimista. Esimerkiksi koneet voisivat auttaa keräämään todisteita tietämyksen arviointia varten. Luomalla alusta, joka tukee tietämykseen liittyvän epävarmuuden ja alkuperän hallintaa eri työkaluissa, voisi mahdollistaa sellaisen käytännöllisen analyysin, jossa yleensä tarvitaan useita analyysityökaluja.

Väi­tös­kir­jan saa­ta­vuus

Väitöskirjan elektroninen versio on saatavilla Helsingin yliopiston e-thesis-palvelussa osoitteessa http://urn.fi/URN:ISBN:978-951-51-7838-1.

Painettuja väitöskirjoja voi tiedustella väittelijältä itseltään: chen.he@helsinki.fi.