Luomuksessa digitoitu miljoona hyönteistä

Luonnontieteellisessä keskusmuseossa Luomuksessa on saavutettu miljoonan digitoidun hyönteisnäytteen virstanpylväs. Digitoinnin avulla luonnon monimuotoisuuden tutkimus, suojelu ja vaaliminen osana maankäytön suunnittelua voidaan perustaa merkittävästi laajempaan tietomäärään.

Helsingin yliopiston luonnontieteellisessä keskusmuseossa Luomuksessa päästiin joulukuussa 2021 miljoonakerhoon, sillä kahdeksan tuntia päivässä käynnissä olevan digitointilinjaston miljoonas hyönteisyksilö päätyi digikokoelmaan joulukuun 7. päivänä 2021. Nyt ollaan jo luvussa 1 031 195.

– Tarkkaa miljoonatta on vaikea sanoa, sillä tietoja lisätään usein tuhansia kerrallaan. Miljoonas näyte osuu tuona päivänä tietokantaan syötettyyn noin 25 000 näytettä sisältävän kotimaisen perhoskokoelman tietoon. Tämä kotkalainen kirjoverkkoperhosnäyte on todennäköisesti miljoonas, sanoo koordinaattori Jere Kahanpää.

Saavutuksen taustalla on vuosien kehittämistyö, jossa digitointiprosessi on tuotu osaksi luonnontieteellisten kansalliskokoelmien perustyötä Luomuksen kaikissa kokoelmatiimeissä. Luomukseen on myös perustettu digitointitiimi tehostamaan digitointia, seuraamaan alan kansainvälistä kehitystä ja sujuvoittamaan sisäistä osaamisen jakamista. Digitiimissä on vakituisen henkilökunnan lisäksi myös harjoittelijoita.

(Noin) miljoonannen näytteen kuvasikin museoavustaja Monika Matikainen hyönteislinjastolla. Hän tutustui hyönteisnäytteiden digitointiin Luomuksen hyönteistiimin korkeakouluharjoittelijana kesällä 2021. Matikainen on biologian maisteriopiskelija Itä-Suomen yliopistosta ja liittyi digitiimiin lokakuussa 2021. Hän digitoi hyönteisnäytteiden lisäksi kasvi-, sammal- ja fossiilinäytteitä.

Miltä nyt tuntuu?

– Tuntuu hienolta nähdä, miten digitiimin ja hyönteistiimin digitointityöskentely on tuottanut tulosta. On hauska sattuma, että noin miljoonas näyte sattui juuri omalle kohdalle, sillä hyönteislinjastolla digitoidaan satoja näytteitä päivittäin, ja töissä on useita henkilöitä, Matikainen toteaa.

Digitointi vaatii myös salapoliisin taitoja

Näytteitä on digitoitu vuodesta 2010 alkaen, mutta tahti on kiihtynyt vuodesta 2015 lähtien, kun Suomen Lajitietokeskuksen kehittämiseen saatiin ensimmäisen kerran Suomen Akatemian rahoitusta Luomuksen edellisen johtajan Leif Schulmanin johdolla. Kuuden viime vuoden aikana on digitoitu nyt saavutetusta miljoonasta näytteestä noin 800 000. Näytteiden kokonaismäärä ei kuitenkaan ole tarkasti tiedossa, joten aivan varmaa maaliviivan sijaintia Luomuksessa ei vielä pystytä antamaan. Kyse voi kuitenkin olla jopa lähes kymmenestä miljoonasta näytteestä.

Jere Kahanpää kuvailee digitoijan työtä:

– Digitointiprosessi vaihtelee paljon sen mukaan, millaista aineistoa käsitellään. Miljoonaan mahtuu kaikenlaista – monesta suunnasta tarkkuusvalokuvatuista arvonäytteistä sata vuotta etanolissa määrittäjäänsä odottaneeseen etelävenäläiseen rukoilijasirkkaan.

Haastavinta – ja usein hienointa – on salapoliisityö, jota tehdään arvokkaimpien näytteiden kanssa. Näistä Kahanpää tarjoaa pari esimerkkiä:

  • Missä oli "Berlinhaf."?
  • John Sahlberg keräsi hyönteisiä vuonna 1866 Pyhäjärveltä, mutta oliko kyse Pyhäjärven kunnasta, Pyhäjärven kunnasta vai Pyhäjärven kunnasta?

Vastaukset arvoituksiin:

”Berlinhaf.” on eläinlajista päätellen Kaakkois-Aasiassa. Ensimmäisen maailmansodan saksalaista sotilaskartoista löytyi ”Berlinhän” Uuden Guinean pohjoisrannikolta, 1800-luvun lopun siirtomaaisäntä-saksan kaukaisimpia kolkkia. Sehän se, kiitos Google, paikka sai koordinaatit. Näyte

Pyhäjärven kuntia oli pahimmillaan tai parhaimmillaan kolme: yksi niistä on nykyinen kaupunki noin 160 kilometriä Oulusta, yksi oli osa nykyistä Karkkilaa, ja kolmas jäi Kannakselle rajan taakse. Sahlberg keräsi hyönteisiä nykyisen Venäjän puolella. Moni noista löydöistä on julkaistukin väärillä tiedoilla Pohjanmaalle kartalla sijoitettuna. Näyte

Miksi digitointi on tärkeää?

Näytteiden keruutiedot, kuten keräysaika ja -paikka, jaetaan avoimen tiedon periaattein Suomen Lajitietokeskuksen kautta. Näin tieto hyönteisten esiintymisestä saadaan merkittävästi aiempaa tehokkaammin tutkijoiden ja viranomaisten käyttöön.

Luonnon monimuotoisuuden tutkimus, suojelu ja vaaliminen osana maankäyttöä yhteiskunnan eri aloilla voidaan perustaa merkittävästi laajempaan tietomäärään.  Osa näytteistä myös kuvataan hyödyntäen nopeasti kehittyviä tekniikoita, kuten digitointilinjaston automaattisesti kohteeseen tarkentavaa kuvausta tai kerroskuvausta, jossa kuvia yhdistetään yhdeksi yksityiskohdat tarkasti näyttäväksi kuvaksi.

Digitoiduista näytteistä kuvataan noin puolet.

– Valikoimme tarkasti kuvattavaksi arvoyksilöitä, mutta sen lisäksi massakuvaamme kokonaisuuksia, joille nopeimmat kuvaustekniikat soveltuvat. Se tarkoittaa esimerkiksi, että kuvattaviksi otetaan kaikki kokoelmien Argidae-heimon sahapistiäiset tai 2021 lahjoitetut perhoset. Pitkän ajan tavoitteena meillä on kuitenkin kuvata kaikki, Kahanpää toteaa.

Aineistot tukevat tieteelle uusien lajien tuntomerkkien julkaisemista, hyönteisseurantaa ja tekoälyn valjastamista lajintunnistukseen. Esimerkiksi suomalaisten mesipistiäisten tiedot on digitoitu kokonaisuudessaan, ja aineiston perusteella on analysoitu tämän tärkeän pölyttäjäryhmän kannanmuutoksia menneinä vuosikymmeninä. Tulokset ovat tärkeää taustatietoa kansalliselle pölyttäjäseurannalle, jonka aloittamista valmistellaan parhaillaan.

Myös muita Suomen luonnontieteellisiä kokoelmia digitoidaan. Kehitystyö on merkittävässä osassa Suomen Lajitietokeskusta, joka pääsi vuonna 2018 kansalliselle tutkimusinfrastruktuurien tiekartalle, jolle valitaan Suomen tutkimus-, koulutus- ja innovaatiotoiminnalle strategisesti merkittäviä palvelukokonaisuuksia. Tiekartalla olevat tutkimusinfrastruktuurit voivat hakea kehittämiseen siihen suunnattua rahoitusta Suomen Akatemialta ja saavat siten tukea pitkäjänteiselle kehittämiselle. Vastaava Tieteellisten kokoelmien digitointiprosessi on käynnissä maailmanlaajuisesti, Euroopassa luonnontieteellisten kokoelmien DiSSCo-konsortion (Distributed System of Scientific Collections - Discco (dissco.eu)) ja Yhdysvalloissa iDigBio-hankkeen (iDigBio Home | iDigBio) koordinoimana.

Digitointityötä sekä tekniikan ja tietojärjestelmien kehittämistä ovat rahoittaneet muun muassa Suomen Akatemia osana Suomen Lajitietokeskuksen kehittämistä sekä  EU:n Synthesys+ -tutkimusinfrastruktuurihanke, joka edistää muun muassa luonnontieteellisten kokoelmien virtuaalista käyttöä.

Luomuksen digitoitujen hyönteisnäytteiden tietoja voi tarkastella Lajitietokeskuksen kautta.