Tekoäly kääntää Kansalliskirjaston digitaaliseksi

Koneoppiminen auttaa tuomaan kulttuuriperinnön kaikkien ulottuville, Heli Kautonen kertoo.

— Tekoäly on liian laaja termi. Se on hyvä yleistermi, mutta tyhjä, kun puhutaan jostain täsmällisestä. Vähän sama kuin sanoisi kehittävänsä internetiä, Heli Kautonen miettii.

Kautonen on paneutunut asiaan palvelupäällikkönä Kansalliskirjaston verkkopalveluyksikössä. Siellä kehitetään kansallisen kulttuuriperinnön ja tieteellisten julkaisujen käyttöä digitaalisessa ympäristössä. Apuna käytetään tekoälyä.

— Töitä tehdään pohjimmiltaan arkisten asioiden kanssa. Tekoäly toimii jo koko ajan Googlessa ja älypuhelimissa. Ne oppivat myös käyttäjiltä. Kansalliskirjastossa sitä tuodaan muuhun kuin kaupalliseen käyttöön. Ennemmin kuin tekoälystä kannattaa puhua siitä, mitä sillä tehdään.

Hakemistot biteiksi

Kansalliskirjasto kalskahtaa syystäkin juhlalliselta: kilometreittäin hyllyjä täynnä kirjoja ja muuta aineistoa historiallisissa tiloissa. Kirjastoon on tallennettu iso pala yhteistä muistiamme vuodesta 1640 lähtien.

Nyt aineisto tahdotaan entistä useamman käyttäjän ulottuville. Sitä varten se täytyy digitoida.

— Kävin äskettäin Norjassa konferenssissa, jossa oli alan ihmisiä ympäri maailmaa. Norjan kansalliskirjasto kehuskeli digitoineensa kaiken aineistonsa. Suomessa ei olla vielä niin pitkällä, Kautonen myöntää.

Ei riitä, että kirjat skannataan digitaaliseen muotoon. Perinteisistä tietokirjoista asiat löytyvät, koska niissä on nimiölehdet ja hakemistot. Digitaalisissa versioissa tarvitaan vastaavia hakuapuja.

Digitaalisessa ympäristössä niitä sanotaan metatiedoiksi. Niiden avulla tietoa voi hakea verkossa täsmällisemmin. Ja metatietojen rakentamisessa hyödynnetään tekoälyä — tai pikemmin koneoppimista.

Ei scifiä vaan arkea

Kansalliskirjaston — ja muiden kirjastojen, museoiden ja arkistojen — digitaalisia aineistoja kootaan Finnaan, hakupalveluun, jossa ne ovat kaikkien saatavilla. Finnalla on jo 2,5 miljoonaa käyttäjää kuukaudessa.

Sekä aineisto että sen kysyntä kasvavat koko ajan. Tarvitaan uusia tapoja etsiä ja jäsentää aineistoja.

— Jos hakee tietoa vaikka Sibeliuksesta, verkosta löytyy hirveästi tuloksia. Tavoitteemme on, että kone linkittää niitä ja tekee päätelmiä siitä, mitkä kuuluvat yhteen, Sibeliuksen tapauksessa esimerkiksi teokset ja monumentti Töölössä. Google, Amazon ja kiinalaiset kehittävät samaa isolla rahalla.

Kansalliskirjastolla, Kansallisarkistolla ja Tieteen tietotekniikan keskuksella CSC:llä on meneillään hanke, jossa koneoppimista hyödynnetään älykkään annotaatioputken luomisessa. Annotaatio tarkoittaa juuri metatiedon rakentamista, linkkejä ja digitaalisia hakemistoja.

Kautonen ei halua juuttua tieteisfantasialta kuulostaviin termeihin.

— Norjan konferenssissa melkein kaikki Stanfordin yliopiston edustajista alkaen kuvittivat esityksiään Metropolis-elokuvalla ja muulla vanhalla scifillä.

Tieteiskuvat eivät välttämättä istu asioihin, jotka ovat jo täyttä arkea, Kautonen huomauttaa.

— Olen Taideteollisesta korkeakoulusta valmistunut designin puolestapuhuja. Tavoitteeni on valjastaa tekniikat tieteen ja kulttuuriperinnön palvelukseen. Ei pidä päästää teknologiaa ja markkinoita jylläämään vain keskenään. Siitä ei seuraa hyvä.

Näytetään tekoälylle mallia

Kansalliskirjastossa on selvitetty käyttäjien toiveita. Muotoilulle on tarvetta. Ei riitä, että löytyy oikeaa tietoa. Sen pitää myös tuntua luotettavalta.

— Myös digitaalisella puolella haetaan tunnetta, että ollaan sivistyksen ja tiedon parissa, samaa arvokkuutta, jota on kirjaston hyllyjen välissä.

Tarvitaan paljon kansallista yhteistyötä, jotta koko valtava kulttuuriperintö saadaan digitaalisesti saataville. Yhteistyö on myös olennaista, ettei jokainen tee omia systeemejään, jotka eivät sovi yhteen. Siinä tarvitaan ihmisiäkin.

— Eivät koneetkaan opi, ellei niitä opeta. Varsinkin aluksi ne tekevät paljon virheitä. Ja vaikka oppiminen olisi koneellista, sitä pitää valvoa. Ihan samalla tavalla teollisuusrobotteja pitää edelleen vahtia tehtaissa.

Kuulostaa siltä, ettei tekoälyn hengenlahjoihin ole paljon luottamista, vaikka nykyisin on muodikasta pohtia, mitä tapahtuu, kun tekoälystä tulee tietoinen ja ihmistä fiksumpi. Joidenkin mielestä lopulta koittaa teknologinen singulariteetti, jossa yli-inhimillinen koneäly alkaa kiihdyttää ihmisenkin kehitystä.

Kautonen suhtautuu unelmiin ja painajaisiin tyynesti, jopa vähän ironisesti.

— Kirjastot ja museot pitävät sisällään inhimillistä sivistystä. Juuri siksi voi olla tärkeää opettaa ne tekoälylle. Jos singulariteetti jonain päivänä tulee, niin onpahan ainakin näytetty sille, miten ollaan ihmisiksi.

Juttua on päivitetty 28.3.: Heli Kautonen on siirtynyt yliopiston likeisen kumppanin, Suomalaisen Kirjallisuuden Seuran palvelukseen, kirjastonjohtajaksi.

Artikkeli on julkaistu Yliopisto-lehden numerossa Y/02/19.