Kuka olet?
Olen
Mikä on tutkimuksesi aihe?
Olen aina ollut kiinnostunut kieliteknologiasta ja sen soveltamisesta ja Kielipankin kautta yhä enemmän myös teknologian kehittämisen ja soveltamisen edellytyksistä:
- Kuinka voimme aineistoja käyttämällä vastata moninaisiin ihmistieteellisiin tutkimuskysymyksiin?
- Mistä saadaan kehitys- ja testiaineistoja, joilla voidaan kehittää ja arvioida aineistojen käsittelymenetelmiä?
- Millaisilla ehdoilla aineistoja voidaan välittää muille tutkijoille, jotta he voivat varmistaa, toimivatko menetelmät väitetyllä tavalla?
Riippumaton menetelmien arviointi on tärkeää, jotta kehitys ei pysähtyisi ja jotta on mahdollista löytää eri tilanteisiin parhaiten sopivat menetelmät. Jos halutaan vain alustava arvio ja pienimuotoinen koe riittää, voidaan antaa ChatGPT:lle pari esimerkkiä ja katsoa, miten se selviää tehtävästä. Jos dataa ei ole tarpeeksi tilastollisen menetelmän luotettavaan käyttöön ja tehtävässä vaaditaan menetelmältä erityistä tarkkuutta, voi olla nopeampaa kehittää menetelmät käsin. Toisaalta, jos dataa on riittävästi, sopiva koneoppimismenetelmä on tarjolla ja käsittely-ympäristökin riittävän tehokas, tämä yhdistelmä tarjoaa usein helpoiten toistettavissa olevan kehityspolun.
Kaikki edellä mainitut kehityspolut ovat datalähtöisiä ja niiden toisintaminen vaatii datan jakamista muiden tutkijoiden kanssa. Aiempina vuosina oltiin hyvin innostuneita lähdeaineistojen täysin avoimesta jakelusta. Vaikka tämä on edelleenkin hyvä tavoite, on paljon aineistoja, joita syystä tai toisesta ei voida välittää aivan kaikille. Tutkijayhteisömme on vähitellen onnistunut lainvalmistelijoiden tuella kehittämään juridisen saatavuusehtojen kehikon, joka mahdollistaa akateemisille tutkijoille riittävän avoimen pääsyn aineistojen tutkimuskäyttöä varten ja mahdollistaa myös tulosten todentamisen suhteellisen mutkattomasti. Samalla aineistot kuitenkin pysyvät riittävän pienen piirin saatavilla, jotta henkilötiedot ja aineeton omaisuus pysyvät turvassa.
Uutena kehitystarpeena on luoda menetelmä, jolla ihmistieteiden tutkijat voisivat keskustella Kielipankkiin tallentamiensa aineistojen sisällöstä tekoälyn kanssa.
Miten Kielipankki liittyy tutkimukseesi?
Kielipankki tarjoaa sekä
Viimeaikaisia julkaisuja
Jauhiainen, T., Zampieri, M., Baldwin, T. C., & Linden, K. (2024).
Jauhiainen, T., Piitulainen, J., Axelson, E., Dieckmann, U., Lennes, M., Niemi, J., Rueter, J., & Linden, K. (2024).
Sahala, A., & Linden, K. (2023).
Linden, K., Niemi, J., & Kontino, T. (Eds.) (2023).
Lindén, K., Ruokolainen, T., Hämäläinen, L., & Harviainen, J. T. (2023).
Kamocki, P., Linden, K., Puksas, A., & Kelli, A. (2023).
Linden, K., Jauhiainen, T., & Hardwick, S. (2023).
Axelson, E., Hardwick, S., & Linden, K. (2023).
Linkkejä
(Common Language Resources and Technology Infrastructure) , ihmistieteiden kansallinen tutkimusinfrastruktuuri (2022–)