Jakso 37: Voiko tekoäly olla luova?

Kesto: 32 min

Haastattelija: Hanna Hantula
Haastateltava: Hannu Toivonen

Hanna Hantula: Hannu Toivonen, mitä jokaisen tulisi ymmärtää isoista kielimalleista?

Hannu Toivonen: Kannattaa ymmärtää se, että ne käsittelee tekstiä ja sanoja. Ne ei käsittele tietoa. Ne ei ymmärrä tekstiä, joka niille annetaan. Ne ei ymmärrä sitä merkitystä, mikä siinä tekstissä on, jonka ne itse tuottaa. Ne vaan manipuloi sanoja. Mutta tämä on hirvittävän hämmentävää meille, koska ihmisille kieli on sisältöjen ja merkitysten kommunikoinnin väline. [rauhallista elektronista musiikkia alkaa soimaan taustalla] Ja nyt kun sitä pelkkää välinettä käytetään, niin me nähdään siellä niitä merkityksiä, joita kielimalli sinne välttämättä ei ole laittanut.

 

[rauhallista elektronista musiikkia, vaimenee taustalle]

 

Hanna: Kuuntelet Helsingin yliopiston Utelias mieli -podcastia, joka puhuu tieteestä tunteella. Tässä podcastissa tutkijat saavat puhua niistä asioista, mitkä heidän mielestään ovat juuri nyt kiinnostavimpia ja tärkeimpiä. Vieraana on tänään tietojenkäsittelytieteen professori Hannu Toivonen Helsingin yliopistosta. Tervetuloa.

Hannu: Kiitos.

Hanna: Minä olen Hanna Hantula, tämän podcastin juontaja.

 

[rauhallista elektronista musiikkia, musiikki vaimenee]

 

Hanna: Hannu, mihin sä olet käyttänyt tekoälyä tänään?

Hannu: No tänään varmaan kaikkein ilmeisimmin reittioppaassa, kun mä katsoin, että miten mä parhaiten pääsen tänne studiolle. Huomasin, että bussissa oli sähkömoottori. Moottorinohjaus, akun latauksen ohjaus, muut, epäilemättä käyttää tekoälyä. Matkalla oli liikennevaloja. Ja niin edelleen ja niin edelleen.

Hanna: Mikä sai sut alun perin kiinnostumaan tekoälystä?

Hannu: Eikö jokainen ole kiinnostunut tekoälystä?

Hanna: No tuntuu, että nykyään ehkä on. Mutta veikkaan, että et aloittanut uraasi ihan tässä tämän vuoden aikana.

Hannu: Joo. Mä olin opiskelija vuonna -90, kun mä kuulin, että Nokialla on tutkimuskeskus. Mä olin siis tietojenkäsittelytieteen opiskelija ja sitten kuulosti tosi jännälle, tutkimuskeskus, mitähän tutkimus on. Ja hain sinne kesätöihin ja pääsin. Ja työpaikka oli nimeltään tietämistekniikan osasto. Siihen aikaan tekoäly terminä ei ollut kovin muodikas, puhuttiin tietämystekniikasta. Ja myöhemmin tein jatko-opinnot, aiheena oli tiedonlouhinta. Nykyään puhuttaisiin datatieteestä. Ja tehnyt muita asioita tässä matkan varrella, mutta jos jälkeenpäin katsoo, niin kaikki sopii tekoäly-kattotermin alle. Mutta mä just havahduin muutama päivä sitten, että varmaan yhdessäkään mun artikkelissa, joita on yli kaksisataa, tuskin missään mainitaan sanaa äly tai tekoäly. Koska se on niin epämääräinen, hämärä kattotermi, että puhutaan tietyistä yksittäisistä ongelmista tai sovelluksista.

Hanna: Okei. Tämä vähän tuhosi mun seuraavan kysymykseni.

Hannu: Ai, sori.

Hanna: [naurahtaa] Joka olisi ollut se, että voitko kerrata meille, että mitä tekoäly oikein on ja mitä se ei ole?

Hannu: Tekoäly tarkoittaa hirvittävän monia asioita riippuen siitä, mistä suunnasta sitä katsotaan. Jos yrittää olla oikein konkreettinen, niin tekoäly on tietokoneohjelmia, jotka automatisoi jotain hankalia, vaikeita asioita. Vaikka nyt sitten se parhaan reitin etsiminen julkisessa liikenteessä paikasta a paikkaan b. Toinen tapa katsoa tekoälyä on se, että se on tutkimusala. Nyt tällä hetkellä puhutaan paljon kielimalleista, mutta tekoäly on paljon muutakin. Kielimallit käyttää neuroverkkoja, neuroverkot tekee koneoppimista. Mutta tämä on vaan yksi osa-alue tekoälyn sisällä. Siihen kuuluu valtavasti muutakin.

Hanna: Jatketaan tällä käsitteen määrittelyn asialla vielä vähän aikaa. Voitaisiin kanssa puhua siitä, että mitä generatiivinen tekoäly tarkoittaa. Eli siis esimerkiksi tämä paljon nyt tänä vuonna uutisissa ollut ja myös juttuja itse kirjoittanut Chat GPT. Mäkin olen siis lukenut kymmeniä hassuttelujuttuja, jossa toimittaja niin sanotusti juttelee Chat GPT:n kanssa. Mutta mitä se oikein tarkoittaa, että tekoäly juttelee tai tuottaa tekstiä? Mitä se siis silloin tekee?

Hannu: Generatiivisuus tarkoittaa sitä, että se tietokoneohjelma on rakennettu ja suunniteltu niin, että se pystyy tuottamaan jotain. Kielimallit perustuu koneoppimiseen. Ne on koulutettu valtavilla tekstimassoilla. Chat GPT:n tapauksessa ei tarkkaan tiedetä, koska sen tekijä Open AI -yritys ei ole kertonut, millä aineistolla se on koulutettu. Mutta GPT-3:sta, edeltävästä versiosta, tiedetään, että siellä oli aineisto, jossa on satoja miljardeja sanoja. Ja toimintamekanismin peruste kielimalleissa on se, että kun niille antaa tekstiä, ne pyrkii jatkamaan sitä annettua tekstiä sen mukaan, että se näyttäisi ikään kuin samantapaiselle jossain mielessä kuin siellä heidän... ”Heidän”, kauheeta, niiden [naurahduksia] opetusaineistoissa on ollut. Nyt mä tein emämokamunauksen, kun mä sanoin heidän.

Hanna: Saadaanko me tähän Matrix-tunnari soimaan?

Hannu: Sovitaan, että mä viittasin näitten tekijöiden, ihmisten, käyttämiin aineistoihin tässä. Joo, tämä tekoälyn ihmismäistäminen on yksi isoja virheitä, mitä keskustelussa tapahtuu. Mutta ei mennä nyt siihen. Eli kielimalli pohjimmiltaan pyrkii jatkamaan tekstiä. Se ei ymmärrä sisältöä, vaan se perustuu tilastolliseen malliin siitä, mitkä sanat, kirjaimet esiintyy mitenkin yhdessä, minkälaisia lauserakenteet, kappalerakenteet, dokumenttien rakenteet on. Ja kun kielimalli käyttää sitä välinettä riittävän hyvin, niin syntyy kuva, että se käsittelee myös niitä merkityksiä.

Hanna: Kaikki mun keskustelut Chat GPT:n kanssa on mennyt siihen, että lopulta se Chat GPT alkaa puhuun vähän niin kuin asiakaspalvelija, joka haluaa nopeesti pois siitä tilanteesta. Että mä olen se hankala tyyppi, josta se haluaa eroon.

Hannu: Ehkä tämä liittyy sitten itse kunkin kokemuksiin. Koska mun kokemus taas on se opettajana, että ne on usein semmoisia pienoisesseitä.

Hanna: Okei.

Hannu: Semmoisia, mitä opiskelijoilta saatettaisiin haluta jossain vastauksessa. Että kun mä kysyn, että kerro Python ohjelmointikielestä, niin sieltä tulee semmoinen pienoisluento. Ja siinä on selkeästi rakenne. On johdanto ja sitten käydään muutama pointti läpi ja sitten on loppuyhteenveto. Ja tämä on osa sitä, miten se on viritetty ja säädetty toimimaan. Se ei ole tämän kielimallin oma valinta, että haluan tehdä tällaisia, vaan se ohjelmoitu toimimaan tietyllä tavoilla.

 

[rauhallista elektronista musiikkia, musiikki vaimenee]

 

Hanna: Tässä podcastissa tutkijat saavat puhua siitä, mikä heistä on oikeasti juuri nyt tärkeää. Tänään studiossa mun kanssa on tietojenkäsittelytieteen professori Hannu Toivonen. Ja me keskustellaan siitä, miten tekoäly on suorastaan loikannut meidän arkikäyttöön ja mitä tämä oikeastaan tarkoittaa. Tänään me puhutaan tosiaan siitä, mitä tekoälyn hyödyntäminen käytännössä tarkoittaa nyt, kun esimerkiksi Chat GPT:n kautta tällaiset suurella kielimallilla varustetut generatiiviset tekoälysovellukset on ekaa kertaa monilla meistä opiskelussa tai työssä käytössä. Kolmisen vuotta sitten tässä samassa podcastissa tutkija Petri Myllymäki sanoi, että ihmisen korvaaminen tekoälyllä on vielä kaukana. Nyt kun Chat GPT raksuttaa muutamalla avainsanalla ihan niitä pätevän oloisia miniesseitä tai vaikka työhakemuksia ja haastattelukysymyksiä, niin itseäni on tämä lausunto alkanut vähän epäilyttään. Vieläkö tämä Petrin lausunto on totta? Ollaanko me turvassa siltä, että tekoäly korvaisi meidät?

Hannu: Joo ja ei. Ehkä ”korvaa meidät” kuulostaa siltä, että meidät voitaisiin korvata kokonaan ja siitä missään nimessä ei ole kyse. Mutta voidaan koko ajan korvata enemmän ja enemmän niitä tehtäviä, joita ihmiset tekee. Ja nyt kielimallien myötä on taas menty eteenpäin siinä, että tekoälyn avulla voidaan automatisoida tehtäviä, joissa aikaisemmin on tarvittu ihmisen älyä. Ei kaikkia tehtäviä, mutta joitain tehtäviä. Että se automatisoitavien tehtävien paletti kasvaa ja laajenee koko ajan.

Hanna: Sun ala on tiede ja tutkimus. Ja Nature-lehti julkaisi alkuvuodesta jutun siitä, millainen uhka Chat GPT on tieteen läpinäkyvyydelle. Millaisia ne uhat on ja miten tiedeyhteisö on lähtenyt niihin vastaamaan?

Hannu: Tieteessä läpinäkyvyys on yksi ihan niitä perusperiaatteita. Eli kun tehdään tutkimus, julkaistaan se, niin sen julkaisun tavoite on toki kertoa ne tulokset, mutta ennen kaikkea myös dokumentoida, selittää läpinäkyvästi, ymmärrettävästi, toistettavasti se, että miten se työ on tehty. Ja nyt jos käytetään kielimallia vaikka kirjoittamaan osa artikkelista tai tuottamaan jotain tietoa, näennäistä tietoa siihen tutkimukseen, niin siitä puuttuu kaikki läpinäkyvyys siihen, että mistä se on peräisin. Vaikka kielimallilta tulisi loistava idea, niin tieteessä se on huono, koska siitä puuttuu se läpinäkyvyys, mihin se perustuu, mitä järkeilyä, mitä syitä siellä on taustalla.

Hanna: Miksi se on salaista? Miksi se ei ole julkista tietoa, että millaisella aineistolla vaikka sitä Chat GPT:tä on koulutettu?

Hannu: No ainakin se on yksi kilpailutekijä. Hyvien kielimallien teko ei ole helppoa. Tiedetään, että monet muut yritykset on käyttänyt valtavat summat rahaa kielimallien kehittämiseen, mutta ei ole pystynyt tuottamaan yhtä hyviä kuin Open AI. Joten se ainakin. He suojelee tietoa siitä, mitä aineistoja he käyttää, miten he kouluttaa niitä kielimalleja, mitä kaikkea säätöä, viritystä siellä tehdään, jotta muut ei pystyisi kopioimaan sitä.

Hanna: Onko sulla jotain veikkauksia, että mitä aineistoa se luultavasti on?

Hannu: Joo. GPT-3:sta, eli se edeltävä versio, niin siitä he julkaisi vielä tiedon, että mitä he on käyttänyt. Se löytyy Wikipediasta. Sen voi sieltä katsoa, että mitä se aineisto sisältää. Mutta siellä on valtavasti sisältöä internetistä. Valikoitua, ei kaikkea. Koska kun kielimallit matkii, jos sinne annetaan roskaa, niin...

Hanna: Voi ei [pieni naurahdus]. Sitähän internetissä tunnetusti ei ole.

Hannu: Joo. Tästä jos tehdään nopea loikkaus suomen kieleen. Turun yliopistossahan on ansiokkaasti kehitetty suomenkielistä kielimallia. Ja meillä on tutkimuskäyttöön kerätty muun muassa Suomi24-foorumilta paljon materiaalia. Sehän on tietysti loistavaa, mutta se saattaa osin näkyä läpi siinä, että kun sillä kielimallilla generoi jotain, niin se saattaa sitten siirtyä siihen Suomi24-moodiin, jolloin tulos ei välttämättä ole sitä, jota käyttäjä halusi.

Hanna: Ja voisin kuvitella, että se saattaa olla aika hyökkäävä se sävy.

Hannu: Muun muassa, joo.

Hanna: Joo.

 

[rauhallista elektronista musiikkia, musiikki vaimenee]

 

Hanna: Hannu, sä olet ollut mukana tekemässä Helsingin yliopiston ohjeita opetukseen ja opiskelijoille tekoälyn käytöstä. Mikä on ok käyttöä tai jopa suositeltavaa käyttöä, jos sellaista on? Ja mikä taas huijaamista?

Hannu: Se, mikä on suositeltavaa käyttöä, niin riippuu siitä, että mitä on tarkoitus oppia. Jos on tarkoitus oppia englantia ja kirjoittamaan englanniksi, niin on erittäin huono idea käyttää siihen kielimallia. Mutta jos on tarkoitus opiskella tietojenkäsittelytieteissä jotain tiettyä aluetta ja kirjoittaa siitä, niin voi olla fiksua käyttää kielimallia vaikka sen kieliasun parantamiseen. Vähän niin kuin nykyään käytetään oikeinkirjoitusohjelmia, niin kielimalliin perustuva työkalu saattaa tehdä sen vähän laajemmin ja monipuolisemmin. Eli tärkeetä olisi aina opettajan ensinnäkin miettiä, että mitkä on ne oppimistavoitteet ja miten kielimalleja voi joko käyttää hyödyksi siinä, että ne oppimistavoitteet saavutetaan, tai miten ne voi olla haitaksi siinä. Ja sitten jos ne voi olla haitaksi, niin sitten semmoinen käyttö pitää kieltää. Ja vastaavasti opiskelijoille täytyy sitten olla selvää, että mitä heidän on tarkoitus oppia, jotta he voi itse myös sitten kriittisesti miettiä, että mihin ja millä tavalla heidän kannattaa käyttää kielimalleja ja miten ei.

Hanna: Mutta onko nämä ohjeet siis tehty sitä varten, että Chat GPT:tä ei käytettäisi vai sitä varten, että sitä käytettäisiin oikein?

Hannu: Sitä varten, että käytettäisiin oikein. Eli sen yleissävy on positiivinen. Siellä sallitaan tekoälyohjelmien, kielimallien käyttö. Ellei sitä sitten perustellusti opettaja erikseen kiellä.

Hanna: Tämä tuntuu jotenkin yllättävän tolkulliselta keskitien linjalta siihen nähden, että tekoälystä puhuessa yleensä aina joko hehkutetaan käsittämättömän upeita uusia mahdollisuuksia tai synkkiä pelottavia riskejä. Ja harvemmin puhutaan ihan arkisista esimerkeistä. Onko näin aina, kun jotain uutta kehitetään vai onko tekoälyssä jotain, mikä saa tällaisen polarisaation ihmisissä aikaan?

Hannu: Tekoäly saattaa olla erilainen. Kyllähän se kutkuttaa mieltä, koska se on jollakin tapaa myös ihmisyyden peili, että mikä erottaa meidät koneesta. Mitä enemmän uusia erilaisia asioita tekoälyn avulla voidaan tehdä, niin se ikään kuin saa meidät ehkä ajattelemaan myös sitten, että okei, mikä tekee ihmisestä ihmisen erotuksena koneeseen, jos kone pystyy käymään fiksun näköistä keskustelua esimerkiksi. Mutta tietysti myös sitten lehdistö myy juttujaan sillä, että jutut otsikoidaan räväkästi ja kärjistetysti ja ne keskitien jutut ei kerää lukijoita välttämättä.

Hanna: Niinhän se valitettavasti menee. Näissä Helsingin yliopiston ohjeissa lukee, että Chat GPT:tä voi käyttää ajattelun apuna. Mitä tämä oikein tarkoittaa? Miten tekoäly oikein voi tehdä meistä parempia ajattelijoita?

Hannu: Kielimallista ehkä ekana tulee mieleen se, että ne generoi tekstiä. Ja opiskelukäytössä eka ajatus voi olla se, että opiskelija tekee sillä tehtävänsä. Mutta ne on hirvittävän joustavia, niitä voi käyttää monen näköisiin tehtäviin, jotka voi pukea sanalliseen muotoon ja jotka perustuu jotenkin tekstin tai sen opetusaineiston käsittelyyn. Eli esimerkkejä voisi olla vaikka aiheen ideointi. Mä aloitan just seminaarin pitoa mun opiskelijoille ja siellä he saa itse valita aiheen, mistä he kirjoittaa siinä seminaarissa. Niin hyvin voi käyttää tekoälyä sen ideointiin. Tai jos on joku aihe mielessä, niin sitten sen sisällä. Tai vaikka pyytää kielimallilta ideoita siihen, että mitä eri näkökulmia mä voisin ottaa tässä huomioon. Ja nämä on silloin, mä ajattelen ja toivon, ne on ikään kuin polttoainetta sille omalle ajattelulle. Että sitten opiskelija voi miettiä, että okei hei, toi aihehan mua kiinnostaa. Toi näkökulma, eihän tuossa ole järkeä, tuon mä jätän sivuun. Mutta nuo on mielenkiintoisia. Ja sitten opiskelija voi lähteä perehtymään niihin enemmän.

Hanna: Mä olen joskus käyttänyt Chat GPT:tä itse lehtijuttua kirjoittaessa siihen, että mä olen kysynyt siltä, että hei aion käyttää tällaista käsitettä, olenko ymmärtänyt tämän oikein. Menisikö tällainen käyttö vielä Helsingin yliopiston sääntöjen puitteisiin?

Hannu: No tässä ollaan ehkä... Säännöt on väljät. Ja siis pitää tehdä tapauskohtaista tulkintaa. Mutta tässä ollaan nyt sitten jo hankalilla vesillä, että jos se käsite on sitä keskeistä opiskeltavaa sisältöä. Ja kielimalli voi tehdä siinä virheitä, se voi vastata sulle väärin. Niin opitko sä siitä jotain, että auttaako se sun oppimista vai ei, se on ehkä se keskeinen kysymys. Mutta usein varmaan tätä rajanvetoa on vaikea vetää.

Hanna: Mites nämä kielimallit tai vaikka nyt tämä Chat GPT asettaa opiskelijoita eri viivalle? Kun miettii sitä, että osa kuitenkin osaa varmaan paremmin käyttää näitä työkaluja hyväkseen ja on vaikkapa varaa ostella maksullisia ohjelmistoja. Miltä tämä näyttää yhdenvertaisuuden näkökulmasta?

Hannu: Hyvä kysymys. Se ei ole ihan ongelmatonta. Onneksi jotain versioita pystyy käyttämään maksutta Chat GPT:stäkin. Mutta rahalla voi saada sieltä parempaa palvelua. Ja tämä on asia, mitä meidän täytyy varmaan kanssa jatkossa pohtia. Tietysti näihin liittyy sitten paljon muitakin kysymyksiä. Kuten vaikka se, että nyt juuri tämä Chat GPT on kaupallinen tuote, sen tarjoaa yksityinen yritys Yhdysvalloissa. Ei ihan tarkkaan tiedetä sen tietosuojan tasoa, että mitä sille tekstille, tiedoille tapahtuu, mitä sinne syöttää. Ja koska ei niin hyvin tunneta sen järjestelmän toimintaa, ei myöskään tiedetä, että mitä se tuottaa käyttäjille.

 

[rauhallista elektronista musiikkia, musiikki vaimenee]

 

Hanna: Tekoälystä ja näistä suurista kielimalleista on tosiaan puhuttu tosi paljon tässä tämän vuoden aikana. Mutta mua silti vähän mietityttää, että hiffataanko me ihan kaikki ihmiset sitä, että millainen tämä murros oikein on, missä me eletään. Esimerkiksi median osalta puhutaan paljon medialukutaidosta. Ja että sitä pitäisi lisätä, että ihmiset osaisi paremmin tulkita vaikka lehtijuttuja tai erilaisia somesisältöjä. Mutta tarvitaanko me tällaista samanlaista ajattelua tekoälyn suhteen? Pitäisikö tekoälyn lukutaitoa ryhtyä jotenkin opettamaan ja kehittämään?

Hannu: Tarvitaan. Ja tämä medialukutaito on hyvä lähtökohta, koska se sisältää oikeastaan jo valtavasti niitä elementtejä. Mutta jos sinne ottaa mukaan sitten vielä tekoälyn lukutaitoa, niin siinä missä medialukutaidossa... No se usein jaetaan ehkä kolmeen osaan. Että yksi on se, että miten ollaan median kuluttajina. Niin nyt sitten, miten me ollaan tekoälyn kohteina. Miten me kriittisesti tarkastellaan tekoälyn avulla tuotettuja sisältöjä. Miten me voidaan ehkä arvata tai aavistaa, että niitä on tuotettu tekoälyllä. Tai valittu tekoälyn avulla, mitä meille näytetään. Niin tämmöinen kriittisyys kuluttajana. Sitten toisaalta itse aktiivisemmassa roolissa ymmärtää vähän, että miten itse voisi ja missä asioissa käyttää ehkä tekoälyä, osata tehdä asioita sen kanssa.

Hanna: Mitä sä ajattelet, se, että meillä on näitä mahdollisuuksia, niin parantaako se myös meidän mahdollisuuksia ymmärtää sitä, milloin me ollaan vaikkapa tekemisissä tekoälyn kanssa, milloin me ollaan tekemisissä vaikka generoidun kuvan kanssa?

Hannu: No ei, kyllähän se suoraan sanoen vaikeammaksi tulee. Koska kun se generointi on kehittynyt, niin on vaikeampi päältäpäin erottaa, että milloin joku asia on automaattisesti generoitu ja milloin ei.

Hanna: Miten tätä sitten voi harjoitella?

Hannu: No yksi on varmaan se, että itse kokeilee ja testailee näitä, että ymmärtää vähän, miten ne toimii, miltä ne tuotokset näyttää. Ja sitten ymmärtää ehkä myös näitä maailman markkinoiden mekanismeja, että ymmärtää ihmisten tai tahojen intressejä käyttää automaattisesti tuotettua sisältöä esimerkiksi, generoida sitä.

Hanna: Mitä sä tarkoitat intresseillä?

Hannu: Se voi olla esimerkiksi tahallinen tarkoitus johtaa harhaan, generoida materiaalia, joka toistaa jotain haluttua näkemystä jostain asiasta. Voi olla myös, että tarkoitus ei ole välttämättä johtaa harhaan, mutta netissä on jo ennen kielimalleja ollut hirvittävä määrä sivustoja, joille on generoitu sisältöä vaikka konekäännöksellä. Ja näitten sivujen tarkoitus ei ole huijata ketään uskomaan sisältöä, vaan ainoastaan houkutella kävijöitä hakukoneiden kautta sinne. Eli he näyttää mainoksia niillä sivuilla. Ja sillä ei ole väliä lukeeko ihminen sisällöstä sanaakaan, kunhan se tulee sinne sivulle ja näkee mainoksen, niin silloin tämän sivuston omistaja saa siitä mainoksesta tuloja itselleen.

Hanna: Mulla itse asiassa just loksahti nyt palasia päässä kohdalleen siinä, että minkä takia viime aikoina tosi usein, kun mä olen etsinyt tietoa jostain vähän enemmän nicheaiheesta internetistä, niin sitten yhtäkkiä päätyy semmoiselle vähän huonolla suomen kielellä kirjoitetulle sivulle, jossa on liuta epäilyttäviä mainoksia, jotka ei millään tavalla näytä siltä, että se olisi ihmistä varten tehty.

Hannu: Joo. Juuri näin.

Hanna: Kiinnostavaa. Tekoälylukutaitoni siis kehittyi juuri tämän keskustelun aikana.

Hannu: Joo. Hakukoneethan on vaihtelevalla menestyksellä pystynyt tunnistamaan näitä. Että Googlen hakukone on ollut hyvä siinä mielessä, että sen kautta on suhteellisen harvoin eksynyt näille roskasivuille. Mutta sitten jotkut muut hakukoneet, jotka ei yhtä hyvin ole pystynyt erottelemaan sitä, niin siellä saattaa olla tuloksissa paljon enemmän tätä roskaa. Ja nyt sitten jää nähtäväksi, että miten tämä kielimallien helpottama tekstin generointi, kuinka hyvin hakukoneet pystyy erottelemaan sitä automaattisesti generoitua sisältöä siitä, mikä on jotenkin mielekästä. Mutta tämä kysymyshän tulee paljon monimutkaisemmaksi vielä, koska tämmöinen binäärinen, kaksijakoinen, luokittelu generoituun tai ei generoituun sisältöön on aika usein myös epärelevantti. Että kielimalleja ja muita tekoälytyökaluja voidaan käyttää eri vaiheissa eri tavoin siihen sisällön tuottamiseen. Ja sitten ei enää voi sanoa lopputuloksesta, onko se ihmisen vai koneen tekemä, vaan siinä on kummallakin ollut sitten eri rooleja.

Hanna: Puhutaan vielä vähän luovuudesta. Sun oma tutkimus on jo pitkään keskittynyt tietokoneluovuuteen. Millainen on luova tietokoneohjelma?

Hannu: Se on ehkä paradoksaalista, että tietokoneohjelma voisi olla luova, koska se noudattaa vaan sille annettua ohjelmaa. Mutta jos luovuuden semmoinen tavallinen määritelmä on se, että se on kyky tuottaa jotain uutta ja tarkoitukseen sopivaa, niin silloin ei mitenkään tämä määritelmä puutu siihen, että kuka tai mikä se luoja on ja miten se sen luomistyön tekee. Eli jos tietokoneohjelma pystyy tuottamaan johonkin tehtävään uusia ja hyviä, tarkoituksenmukaisia ratkaisuja, niin silloin se on tämän määritelmän mukaan luova. Ja nyt sitten ne mekanismit, joilla sitä luovuutta voidaan rakentaa, niin niitä on tietysti hirvittävä määrä. Ettei ole olemassa mitään yhtä luovuuden kaavaa sen enempää kuin olemassa yhtä älykkyyden kaavaakaan, jolla tekoäly voitaisiin toteuttaa. Mutta siellä voi käyttää nimenomaan tietokoneiden vahvuuksia, että isojen datamassojen käsittely, nopea tiedonhaku, asioiden yhdistäminen, tietynlainen arviointi, mittaaminen. Että jos ihmisenkin luovuus on usein sitä, että muokataan jotain jo olemassa olevaa tunnettua, tai yhdistetään pari asiaa.

Hanna: Sanoisitko sä, että Chat GPT on luova?

Hannu: Lyhyt vastaus on kyllä. Mutta pitkä vastaus on se, että luovuuskaan ei ole ominaisuus, joka jollain joko on tai ei ole. Vaan sitten voidaan keskustella siitä, että missä tehtävissä, missä asioissa, missä määrin se on luova. Mutta se on luova siinä mielessä, että se pystyy tuottamaan tekstiä, jota sen opetusaineistossa ei ole ollut ja joka sopii siihen kyseiseen tarpeeseen.

Hanna: Mua kiinnostaa vielä tekoälyn tulevaisuus.

Hannu: Niin muakin.

Hanna: No voi että [naurahduksia]. Toivottavasti sua kiinnostaa se siinä mielessä, että-

Hannu: Mitä sä arvelet, että missä me ollaan vuoden tai viiden vuoden kuluttua?

Hanna: Onko tämä kysymys mulle vai?

Hannu: Se on sulle, joo.

Hanna: Aha, okei. Odottamaton käänne tähän keskusteluun. Missä me ollaan, mitä sä sanoit, viiden vuoden kuluttua, kymmenen vuoden kuluttua?

Hannu: Niin, vuoden tai viiden vuoden.

Hanna: En mä tiedä, musta tuntuu, että mulle tuli aika puskista ihan vaan tämä, että yhtäkkiä voi käydä suht koherentteja keskusteluja muittenkin kuin semmoisten asiakaspalveluchattien kanssa internetissä. Mutta en mä ymmärrä tekoälystä mitään. Mä jotenkin fantasioisin ehkä siitä, että mä voisin vaikka sanoa Chat GPT:lle, että... Ei kun ei. Ei itse asiassa sittenkään. Mä olin sanomassa, että mä voisin sanoa Chat GPT:lle, että kirjoitapa mulle yksi osa lisää tähän fantasiakirjasarjaan, joka jäi ikävästi kesken, että mä pääsen näkemään, että mitä siinä tapahtuu. Mutta kyllä siitä tulee aika surullinen olo, kun tuon sanoo ääneen, että en mä ehkä sellaisessa tulevaisuudessa haluaisi elää. Mutta ehkä toi on se tulevaisuus, mitä mä pelkään. Onko mulla syytä pelätä tällaista?

Hannu: En mä tiedä. Mä olen itse kanssa miettinyt tätä kirjoittamista jonkun verran. Ja jos mä ajattelen itseäni lukijana, niin kuriositeettina olisi jännittävä lukea tietokoneohjelman generoima romaani. Mutta kyllä mä jotenkin ajattelen, että kirjallisuudessa mä lukijana oletan, että siellä kirjoittajana on toinen ihminen. Että kun sillä kielimallilla ei ole mitään sanottavaa. Se vaan laittaa niitä sanoja peräkkäin. Niin vaikka se sama kirja, tai vaikkapa runo, oli se sitten ihmisen tai koneen kirjottama, niin kyllä mä lukijana itse suhtautuisin siihen ihan eri tavalla. Kun jos mä tiedän, että sen on ihminen kirjoittanut, sillä on joku näkemys ja ajatus tästä maailmasta, jota se teksti heijastaa ja se kirjoittaja on halunnut siihen laittaa.

Hanna: Niin ja se kielimalli ei ehkä halua kommunikoida mitään...

Hannu: Niin.

Hanna: ...mutta se tietää mistä naruista vedellä, jotta se voi olla sulle mieliksi.

Hannu: Joo, kyllä. Tämä on ehkä yksi niitä uhkakuvia, että meille pystytään tuottamaan, generoimaan semmoista sisältöä lennossa, joka tekee meidät tyytyväiseksi. Että jos ajatellaan analogiaa sosiaaliseen mediaan, jossa nyt enimmäkseen käyttäjät, firmat, muut tuottaa sitä sisältöä. Ja sosiaalisen media järjestelmät toimii niin, että sieltä valikoituu meille niitä sisältöjä, mitkä herättää meidän huomion ja pitää meidät koukussa sen sosiaalisen median käyttämiseen. Niin jatkossa, voidaanko jotain samantapaista tehdä vielä personoidummin, että meille tuotetaan, generoidaan semmoista sisältöä, joka saa juuri meidät vielä lukemaan seuraavan jutun ja seuraavan jutun.

Hanna: Eli tällaisten Chat GPT:n, tai ei nyt ehkä edes Chat GPT:n, vaan ylipäätään tekoälyn kehittämiseen liittyy aika paljon valtaa?

Hannu: Valtavasti valtaa, joo kyllä. Ja juuri tämä on yksi, että missä ja miten ja kuka päättää tai vaikuttaa siihen, että mitä informaatiota me saadaan. Niin se on yksi huomattava vallankäytön muoto, joka ei ole ehkä ilmeinen, mutta vaikuttaa valtavasti siihen, mitä me asioista ajatellaan ja miten me sitten toimitaan niitten meidän ajatusten ja arvojen perusteella.

 

[rauhallista elektronista musiikkia, musiikki vaimenee]

 

Hanna: Kenen elävän tai kuolleen tutkijan kanssa menisit drinkeille, minne menisitte ja mitä joisitte?

Hannu: Mä menisin iltapäiväteelle Ada Lovelacen kanssa. Hänet tunnetaan ensimmäisenä ohjelmoijana. Sattui olemaan myös runoilija lordi Byronin tytär, mutta ei sen vuoksi. Ada Lovelace oli matemaatikko, työskenteli Charles Babbage -nimisen matemaatikon kanssa. Nyt ollaan siis 1800-luvun alkupuolella ja Englannissa. Babbage kehitti tämmöistä mekaanista tietokonetta. Kaikkien aikojen ensimmäinen tietokone. Valitettavasti se ei koskaan valmistunut, sen ajan tekniikalla se oli mahdoton tehdä. Mutta Babbage käytti siihen vuosikymmeniä. Ja Ada Lovelacen suuri ansio oli se, että hän ymmärsi sen koneen ja näki sen potentiaalin siinä, se tehtiin laskukoneeksi oikeastaan, mutta Ada Lovelace ymmärsi, että sitä voi käyttää yleiskäyttöisenä tietokoneena. Ja suunnitteli, kirjoitti sille tietokoneohjelmia, joita ei valitettavasti koskaan voitu ajaa, kun se tietokone ei valmistunut. Mutta siis huikea visionääri silloin 1800-luvun alkupuolella.

Hanna: Mikä tekoälyyn liittyvä teos jokaisen olisi tärkeää lukea, katsoa tai kuunnella? Saa olla ihan mitä vaan kulttuuria.

Hannu: No nyt mä vedän kotiinpäin. Se on tietysti mun uusi kirja Mitä tekoäly on? 100 kysymystä ja vastausta. Ja mä olen pyrkinyt kirjoittamaan sen mahdollisimman helppolukuiseksi, sen voi avata mistä kohti vaan. Ei tarvitse lukea alusta loppuun, voi selailla. Lyhyitä tekstejä ja mahdollisimman helppotajuisia.

Hanna: Jos voisit tehdä yhden pakollisen kurssin, mikä jokaisen ihmisen olisi käytävä, niin mikä se oikein olisi?

Hannu: Mua itseäni on alkanut kiinnostaa enemmän ja enemmän yhteiskunnalliset asiat, nyt muun muassa tämän tekoälyn vuoksi. Että mä itse ehkä etsisin niitä kursseja, niitä varmasti löytyy. Mutta ehkä se yksi kurssi, joo, joka jokaisen pitäisi käydä, niin se olisi tämmöinen katsaus yli tieteenalojen. Sieltä tulisi aika tiivis kurssi, mutta joka tieteenalasta hyvin napakka esitys siitä, että mikä on sen tieteenalan ydin, mitä siinä tarkastellaan ja miten. [rauhallista elektronista musiikkia alkaa soimaan taustalla] Se olisi mullekin ihan huikeeta ymmärtää paremmin kaikkia muita tieteenaloja, niitten kysymyksiä ja tavoitteita.

Hanna: Hannu Toivonen, kiitos kun olit mukana Utelias mieli -podcastissa.

Hannu: Paljon kiitoksia.

 

[rauhallista elektronista musiikkia, vaimenee taustalle]

 

Hanna: Kiitos, kun kuuntelit Utelias mieli -podcastia. Jos tykkäsit kuulemastasi, kerro siitä kaverillesi.

 

[rauhallista elektronista musiikkia, musiikki vaimenee]