Data-analyysi louhii tietoa
Tietoa kyllä löytyy, mutta miten saada siitä tolkkua? Nykytieteellä on käytössään entistä tehokkaampia mittaamisen ja tiedonkeruun menetelmiä. Tietokoneet kykenevät yhä järeämpiin laskentasuorituksiin. Paisuvista materiaaleista voidaan poimia esiin olennaiset asiat tiedonkäsittelymenetelmillä, jollaisia Algoritmisen data-analyysin huippuyksikössä kehitetään.
– Kun selvitetään sitä, minkälainen geenihäiriö aiheuttaa jonkin sairauden, pitää käsitellä tietoa yli kahdenkymmenentuhannen geenin yhtäaikaisesta toiminnasta, kertoo huippuyksikön johtaja, professori Esko Ukkonen yhdestä tyypillisestä data-analyysiongelmasta.
Toisenlaisen valtavan tietomassan kanssa joudutaan painimaan, kun yritetään jäljittää uusien asioiden ilmestymistä Internetiin. Kielentutkijat voivat automaattisella analyysilla piirtää kartalle murrerajoja, eläintentutkijat taas lajien levinnäisyysalueita.
Huippuyksikkö kehittää data-analyysimenetelmiä tiiviissä yhteistyössä esimerkiksi molekyylibiologian, lääketieteen, ympäristötutkimuksen, lingvistiikan ja tietoliikenteen tutkijoiden kanssa. Näiden alojen tuoreita ongelmia varten kehitellään analysointimenetelmiä eli algoritmeja ja niiden pohjalta tietokoneohjelmia, joihin massiiviset tietomäärät voidaan syöttää.
– Menetelmien kehittämisessä meille keskeisiä alueita ovat kombinatorinen hahmonsovitus ja tiedon louhinta. Niissä olemme maailman johtava tutkimusryhmä, Ukkonen sanoo.
Molemmilla menetelmillä etsitään erilaisia säännönmukaisuuksia ja kiinnostavia ilmiöitä mittavista datakokoelmista ja sellaisista merkkijonoista kuin luonnollinen kieli tai DNA.
Huippuyksikkö aloittelee toista toimintakauttaan. Uutena mukaan on tullut dosentti Aapo Hyvärisen tutkimusryhmä, joka tutkii erittäin moniulotteisen datan piileviä rakenteita.
– Tällaista menetelmää tarvitaan esimerkiksi näköjärjestelmän mallintamisessa. Näön avullahan saadaan valtava määrä tietoa, josta kuitenkin erotetaan vain merkittävät asiat, Ukkonen havainnollistaa.
Teksti: Tiina Männistö
Kuva: Veikko Somerpuro
Julkaisut, tutkimusyksiköt, tutkijat
Helsingin yliopisto tukee tutkimusjulkaisujen avointa saatavuutta