Kielipankissa kuka tahansa kiinnostunut pääsee tutkimaan esimerkiksi Aleksis Kiven kirjeitä, vanhoja sanomalehtitekstejä Kansalliskirjaston kokoelmista, Suomi24-foorumin keskusteluja tai vaikka tasavallan presidentin uudenvuodenpuheita.
Kielipankki on eri alojen tutkijoille suunnattu palvelukokonaisuus, joka kerää ja tarjoaa käyttöön teksti- ja puheaineistoja. Monet sen aineistoista ovat myös julkisessa käytössä ja siten kenen tahansa tarkasteltavissa. Kielipankissa on suomen lisäksi muidenkin kielten aineistoja – myös monikielisiä käännöskorpuksia.
Tiettyjen Kielipankin aineistojen käyttö on rajoitettua esimerkiksi tekijänoikeuksien tai tietosuojan vuoksi. Jotkut niistä saa käyttöönsä yksinkertaisesti kirjautumalla oman yliopiston tunnuksella. Tiukemmin rajoitettuihin aineistoihin voi hakea tarvitsemiaan käyttöoikeuksia kätevässä verkkopalvelussa.
Kieliaineistot eivät rajoitu vain tekstiin ja puheeseen. Kielipankista löytyy myös viittomakielisiä aineistoja.
- Viittomakielten aineistot ovat nousussa, kertoo projektisuunnittelija Mietta Lennes.
Yhteistyössä Kuurojen liiton kanssa Kielipankkiin on saatu Suomen viittomakielten kielipoliittinen ohjelma, tietysti viitottuna.
Kirjallisuutta ja keskustelufoorumeja
Suomi24-keskustelufoorumin aineistohaun avulla tutkija voi tarkastella vaikkapa kaunokirjallisuudesta levinneiden sanojen käyttöä yleiskielessä. Millaisia ilmaisuja voitaisiin etsiä? Mietta Lennes antaa esimerkkejä ja opastaa haun tekemisessä.
– J. K. Rowlingin Harry Potter -kirjoista tuttu jästi-sana saa paljon osumia keskustelufoorumin osiossa Viihde ja kulttuuri, mutta myös osioissa Lemmikit ja Suhteet.
Useimmat Kielipankin Korp-hakupalvelussa olevat aineistot on jäsennetty kieliopillisesti, jolloin esimerkiksi kaikki jästi-sanan eri muodot löytyvät yhdellä haulla.
Korp-palvelun avulla voidaan myös selvittää, että Tuomas Kyrön Mielensäpahoittaja-hahmon tunnuslause ”Kyllä minä niin mieleni pahoitin” alkaa esiintyä foorumilla useammin ensimmäisen elokuvan julkaisuaikoihin.
Murreilmaisuista kiinnostunut tutkija löytää Suomen kielen näytteitä -aineistosta erilaisia variaatioita esimerkiksi yleispuhekielen sanasta metsä: itämurteissa sanotaan usein ”mehtä”, länsimurteissa puolestaan ”mettä” tai ”messä”.
Kielen ja kulttuurin tallentamista yhteistyöllä
Kielipankki on FIN-CLARIN -konsortion tarjoama palvelukokonaisuus. FIN-CLARINin muodostavat suomalaiset yliopistot ja tutkimusorganisaatiot. Se toimii Kielipankin tukiverkostona. Sen sisällä aineistojen hankkimisesta, työkaluista ja koulutustoiminnasta huolehtii Helsingin yliopisto. Kielipankin teknisestä ylläpidosta vastaa CSC – Tieteen tietotekniikan keskus, joka myös on FIN-CLARINin jäsen.
– FIN-CLARINin tavoitteena on varmistaa aineistojen saatavuus ja pysyvyys. Samalla autamme tutkijoita saamaan ansaitsemaansa tunnustusta kieliaineistojen keräämisestä ja jakamisesta, Mietta Lennes kertoo.
Kaikki Suomessa toimivat tutkijat ja tutkimusryhmät voivat tarjota kieltä sisältäviä aineistojaan FIN-CLARINin välitettäviksi.
"FIN-CLARINilla on myös kulttuurihistoriallinen merkitys kielen ja kulttuurin tallentajana."
– Kielipankin kautta tarjotaan tutkijoille erilaisia työkaluja aineistojen käsittelyyn ja tutkimiseen, esimerkiksi hakutoimintoja, aineistojen automaattista jäsennystä ja muuta prosessointia. FIN-CLARINilla on myös kulttuurihistoriallinen merkitys kielen ja kulttuurin tallentajana.
FIN-CLARIN kuuluu kansainväliseen CLARIN ERIC -tutkimusinfrastruktuuriin, jossa on mukana 18 maata. Kielipankki vietti 20-vuotisjuhlaseminaariaan 9.–10. kesäkuuta.