Kielipankissa: Veronika Laippala

Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Veronika Laippala kertoo suuriin kieliaineistoihin ja laskennallisiin menetelmiin liittyvästä tutkimuksestaan.

Kuka olet?

Olen Veronika Laippala ja toimin digitaalisen kielentutkimuksen professorina ja -tutkimusryhmässä.

Mikä on tutkimuksesi aihe?

Suurin osa tutkimuksestani liittyy tavalla tai toisella kielenkäyttöön: suuriin, useimmiten internetistä koostettuihin aineistoihin ja laskennallisiin menetelmiin. Lisäksi olen ollut mukana kehittämässä suomenkielistä kieliteknologiaa, kuten -puupankkia ja -nimientunnistusjärjestelmää.

Tällä hetkellä meillä on käynnissä useita hankkeita, joissa työstetään internetpohjaisia kieliaineistoja tarkastelemalla niissä käytettäviä tekstilajeja ja kehittämällä koneoppimismenetelmiä, jotka tunnistavat tekstilajeja automaattisesti. Tällaisista menetelmistä ja välineistä hyötyisivät sekä internetin käyttäjät ylipäätään että internetpohjaisia kieliaineistoja käyttävät tutkijat.

Miten Kielipankki liittyy tutkimukseesi?

Kielipankin laaja aineistovalikoima antaa mahdollisuuksia vaikka mihin! Eniten olen luultavasti käyttänyt -aineistoa, joka on laajuudessaan ainutlaatuinen. Lisäksi puupankkimme pohjalta kehitettyä syntaksijäsennintä käytetään Kielipankin aineistojen jäsentämiseen. Ja tietysti opetan kursseillani käyttöä.

Kielipankkiin liittyviä julkaisuja

Liina Repo, Valtteri Skantsi, Samuel Rönnqvist, Saara Hellström, Miika Oinonen, Anna Salmela, Douglas Biber, Jesse Egbert, Sampo Pyysalo & Veronika Laippala (2021). . Proceedings of the 16th Conference of the European Chapter of the Association for Computational Linguistics: Student Research Workshop, pp. 183–191.

Veronika Laippala, Jesse Egbert, Douglas Biber & Aki-Juhani Kyröläinen (2021). . Language Resources and Evaluation, Vol. 55, pp. 757–788.

Lisätietoa Kielipankissa olevista kielivaroista

 eli suomalaisten yliopistojen, Tieteen tietotekniikan keskuksen ja Kotimaisten kielten keskuksen muodostama konsortio auttaa humanististen tieteiden tutkijoita käyttämään, jalostamaan, säilyttämään ja jakamaan tutkimusaineistoja. Aineistoja ja työkaluja tarjoaa .