Vesialueet pitävät sisällään arvokasta dataa meren tilasta: lajistoista ja niiden muutoksista, biodiversiteetistä, ihmisen vaikutuksista meren laatuun. Tätä dataa voitaisiin hyödyntää aiempaa paremmin viheliäisten ongelmien ratkaisuun.
Siksi Helsingin yliopisto järjestää avoimen Datatiedettä vesiekosysteemien seurantaan -verkkokurssin, jota luotsaa tietojenkäsittelytieteen professori Petteri Nurmi. Maa- ja vesitekniikan tuki ry tukee kurssia, jossa hyödynnetään tietojenkäsittelyn menetelmiä vesialueisiin liittyvien haasteiden käsittelemiseen. Kurssi on englanninkielinen ja opetus alkaa keväällä 2026.
– Aiemmassa tutkimuksessani ja opetustyössäni olen huomannut, että sensoridatan analyysissä on erityispiirteitä, joita datatieteen peruskurssit eivät yleensä käsittele. Siksi halusimme luoda kurssin, joka tukee eri alojen opiskelijoita tästä näkökulmasta, Nurmi sanoo.
Hän on aiemmin ollut luomassa sensoridatan analyysiä ja esineiden internetiä käsittelevää kurssia. Siitä inspiraatio ja tausta vesiekosysteemien ja datatieteen yhdistämiseen alun perin syntyi.
Tuleva Datatiedettä vesiekosysteemien seurantaan -kurssi on suunnattu kanditutkinnon loppuvaiheen ja maisterintutkinnon alkuvaiheen opiskelijoille, mutta Nurmen mukaan johdantokurssi tarjoaa hyödyllistä taustatietoa ja metodiikkaa myös tohtoriopiskelijoille. Kurssilla on mahdollista tehdä eri vaikeustasojen tehtäviä oman osaamisen mukaan.
Koko datan keruun ja käsittelyn prosessi haltuun
Tietojenkäsittelytieteessä on tutkittu aiemmin esimerkiksi sensoriteknologia- ja esineiden internet -ratkaisuja vesialueilla, muoviroskien tunnistamista ja biodiversiteettiä vesiekosysteemeissä. Vesialueet ovat Nurmen mukaan olleet tietojenkäsittelytieteessä tärkeitä sovellusalueita, mutta varsinaista johdantoa niihin ei ole yliopistossa ollut tarjolla.
– Monet tutkijat hyödyntävät jo insinööritieteiden menetelmiä vesialueiden tutkimuksessa, mutta meiltä puuttuu systemaattinen koulutus siihen. Tämä kurssi paikkaa juuri sitä aukkoa.
Kurssilla käydään koko datan keruun ja käsittelyn prosessi läpi alusta loppuun: mitä datan keruu on, kuinka usein sitä kerätään ja millä tarkkuudella, mitä virheitä datassa voi olla ja miten sitä lopulta “siivotaan” ja hyödynnetään esimerkiksi koneoppimisalgoritmien kehittämisessä.
Tehtävät liittyvät monipuoliseen vesidataan: esimerkiksi pH-arvojen ja lämpötilan kaltaisiin vesiparametreihin sekä kuvantamiseen ja biodiversiteettiin liittyvään dataan. Kurssilla on tarkoitus hyödyntää merenalaisten anturien, kuten hydrofonien eli merenalaisten mikrofonien keräämää tietoa. Myös Helsingin yliopiston MONICOAST-tutkimushankkeen poijujen keräämää pitkäaikaisdataa Itämerestä voidaan mahdollisesti hyödyntää.
– Tarkoitus on tuoda monipuolisesti esiin sisältöä, joka sopii niin datatieteen opiskelijoille kuin luonnontieteilijöille. Monitieteisenä vesiekosysteemejä ja datatiedettä yhdistävänä johdantokurssina tämä on ainut laatuaan Suomessa, Nurmi sanoo.
Kurssi toteutetaan avoimena verkkokurssina (MOOC). Kun kurssi on julkaistu, sille voi kirjautua kaikkialta maailmasta.