Kielipankissa: Jussi Ylikoski

Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Jussi Ylikoski kertoo tutkimuksestaan, joka liittyy suomen ja sen sukukielten kieliopillisiin piirteisiin ja niiden kehitykseen.

Kuka olet?

Olen Jussi Ylikoski, kielentutkija. Työskentelen viidettä vuotta Oulun yliopistossa saamen kielen professorina, mutta syksystä 2022 alkaen Turun yliopiston suomalais-ugrilaisen kielentutkimuksen professorina. Olen siis aika monen kielen tutkija, myös suomen.

Mikä on tutkimuksesi aihe?

Tutkimusaiheita on riittänyt suomen ja sen sukukielten parissa, välillä osin niiden ulkopuolellakin. Eniten olen tutkinut tuttujen ja tuntemattomampien kielten kielioppeja eli muoto- ja lauseoppia, mutta välillä myös muun muassa etymologiaa. Nykykieliä tutkiessani en useinkaan malta olla tarkastelematta kieliä myös niiden kehityksen näkökulmasta, kielihistoriaa tutkiessani puolestaan kiinnitän tavallista enemmän huomiota nykykielten todelliseen käyttöön todellisten tekstiaineistojen valossa.

Miten Kielipankki liittyy tutkimukseesi?

Kielipankin aineistoja olen käyttänyt etenkin suomen kielen kieliopin tutkijana. Jo vuonna 2003 julkaisin artikkelin, jossa selvitin Kielipankissa olevan Suomen kielen tekstikokoelman avulla, että ns. 5. infinitiivinä tunnettua verbimuotoa (-maisillaan, –mäisillään) käytetään monella muullakin tavalla kuin vain olla-verbin yhteydessä, toisin kuin kieliopit aina olivat esittäneet. Esimerkiksi otsasuonet eivät välttämättä vain ole repeämäisillään vaan ne voivat myös vaikkapa pullistella repeämäisillään – tai joku raukka voi peloissaan odottaa jotain otsasuonet repeämäisillään.

Viime vuosina olen innostunut entistä suuremmista, miljardien sanojen laajuisista tekstimassoista, joita on saatavilla Kielipankin ja muiden CLARIN-palveluiden kautta. Tutkimuksessani olen käyttänyt mm. Helsingin yliopiston suomenkielisen E­-thesiksen Korp­-versiota, Kansalliskirjaston sanoma­ ja aikakauslehti­kokoelman suomenkielistä osakorpusta, Suomi 24 ­-korpuksen eri versioita, Ylilauta-korpusta sekä 1990- ja 2000-luvun suomalaisia aikakaus- ja sanomalehtiä -korpuksen versiota 2.  Laajojen aineistojen avulla myös suomen kaltaisesta todella hyvin tunnetusta ja tutkitusta kielestä on mahdollista löytää tavallaan jopa uusia sijamuotoja. Olen tarkastellut mm. vanhastaan prolatiiviksi kutsuttujen muotojen lauseoppia ja havainnut niiden käytössä sijamaisempia piirteitä kuin mitä aiemmassa tutkimuskirjallisuudessa on esitetty. Kyse ei aina ole vain yksittäisistä sanoista (esim. maitse ja meritse), vaan niitä voivat määrittää myös sivulauseet (esim. mailitse jossa on helpompi kaunistella asioita ja tekstiviestitse joihin turhan harva vastaa).

Jännittävimpiä havaintoja olen tehnyt tutkiessani sellaisia aiemmin selvinä johdoksina pidettyjä muotoja kuin lauantaisin ja viikonloppuisin tai kunnittain ja aihealueittain. Kielipankin Korp-käyttöliittymällä on mahdollista löytää miljardien sanojen kokoisista aineistoista satoja tai jopa tuhansia suhteellisen luontevia lauseita, joissa tällaisillakin muodoilla on erilaisia määritteitä, jotka saavat ne näyttämään substantiivien taivutusmuodoilta: elokuun lauantaisin, joka lauantaisin, satunnaisin viikonloppuisin tai vaikkapa Suomen kunnittain, eri maittain ja tietyin aihealueittain. Koska tällaiset temporaalit (lauantaisin) ja distributiivit (kunnittain) käyttäytyvät hyvin sijamaisesti, olen leikkisästi kutsunut kyseisiä muotoja ”kääpiösijoiksi” samaan tapaan kuin aiemmin planeettana tunnettua Plutoa kutsutaan nykyään kääpiöplaneetaksi.

Johdosten ja taivutusmuotojen rajankäyntiin uppouduttuani olen päätynyt tarkastelemaan myös esimerkiksi suomen abessiivia (rahatta, internetittä jne.) ja ns. t-akkusatiivia (minut, meidät jne.) aiempaa perusteellisemmin. Itse havainnoin ja kuvaan aiemmin tuntemattomiksi jääneitä muotoja ja lauserakenteita mieluiten deskriptiivisen kielentutkimuksen keinoin, mutta Kielipankin välineet tarjoavat paljon mahdollisuuksia myös kvantitatiivisesta analyysista kiinnostuneille.

Kielipankin ohella olen käyttänyt vähintään yhtä paljon tromssalaisten kieliteknologien tuottamia saamelaiskielten ja monien muidenkin uralilaisten vähemmistökielten korpuksia, jotka hyödyntävät samaa Korp-käyttöliittymää kuin suomalainen Kielipankki. Suomen sukukielten ystävät löytävät kyseisiä aineistoja Tromssan yliopiston Giellateknon ylläpitämästä Korp-palvelusta (saame ja muut sukukielet). Vaikkapa 63 miljoonaa sanaa annotoitua maria – voiko fennougristi enempää toivoa?

Kielipankkiin liittyviä julkaisuja

Ylikoski, Jussi. 2003. Havaintoja suomen ns. viidennen infinitiivin käytöstäSananjalka 45. 7–44.

Ylikoski, Jussi. 2018. Prolatiivi ja instrumentaali: suomen –(i)tse ja –teitse kieliopin ja leksikon rajamailla. Sananjalka 60. 7–27.

Ylikoski, Jussi. 2020. Kielemme kääpiösijoista: prolatiivi, temporaali ja distributiivi. Virittäjä 124. 529–554.

Ylikoski, Jussi. 2021. Abessiivin apologia. Puhe ja kieli 41. 139–157.

Ylikoski, Jussi. 2021. Mistä voisin löytää sen entisen sinut? Suomen kielen akkusatiivi- ja pronominioppia. – Leena Maria Heikkola, Geda Paulsen, Katarzyna Wojciechowicz & Jutta Rosenberg (toim.), Språkets funktion. Juhlakirja Urpo Nikanteen 60-vuotispäivän kunniaksi. Festskrift till Urpo Nikanne på 60-årsdagen. Festschrift for Urpo Nikanne in honor of his 60th birthday. Åbo: Åbo Akademis förlag. 220–243.

Lisätietoa Kielipankissa olevista aineistoista

FIN-CLARIN eli suomalaisten yliopistojen, Tieteen tietotekniikan keskuksen ja Kotimaisten kielten keskuksen muodostama konsortio auttaa humanististen tieteiden tutkijoita käyttämään, jalostamaan, säilyttämään ja jakamaan tutkimusaineistoja. Aineistoja ja työkaluja tarjoaa Kielipankki.