Yliopiston etusivulle Suomeksi På svenska In English
Helsingin yliopisto Humanistinen tiedekunta
 

Humanistinen tiedekunta

 

 

Ajankohtaista

Digitaalinen sukupuutto uhkaa eurooppalaisia kieliä

Euroopan johtavat kieliteknologian asiantuntijat varoittavat, että suurin osa eurooppalaisista kielistä ei todennäköisesti selviydy digitaalisena aikana. Yksi näistä kielistä on suomi.


Tuoreesta Euroopan-laajuisesta kieliteknologian tutkimuksesta käy ilmi, että suurin osa eurooppalaisista kielistä uhkaa kuolla digitaaliseen sukupuuttoon. Asiantuntijat arvioivat noin 80 eurooppalaiskielen joukosta 30 eri kielelle tarjolla olevaa tukea ja päättelivät, että 21 kielen digitaalinen tuki on olematon tai parhaimmillaankin heikko.

Tutkimuksen toteutti Euroopan huippuosaamisen verkosto META-NET, joka koostuu 60 tutkimuskeskuksesta 34 eri maassa. Suomesta mukana on tutkijoita Helsingin yliopiston nykykielten laitokselta sekä Aalto-yliopiston tietojenkäsittelytieteen laitokselta.


Usealla kielellä heikko tai olematon tuki

Yli 200 asiantuntijan tuottaman META-NET Valkoiset kirjat-julkaisusarjan 30 niteessä jokaisen kielen kieliteknologista tukea on dokumentoitu ja arvioitu neljän eri sovellusalan mukaan: konekäännös, puheenkäsittely, tekstinanalyysi ja kielivarojen saatavuus.

Asiantuntijat sijoittivat 30 kielestä 21 (70 prosenttia) alimpaan luokkaan ("tuki on heikko tai olematon") ainakin yhdellä sovellusaloista. Useat kielet, esimerkiksi islanti, latvia, liettua ja malta saivat alimmat pistemäärät kaikilla neljällä sovellusalalla.

Kun kielellä on heikko tuki, ongelmia voi tulla esimerkiksi, kun haluaa tarkistaa tekstinsä kieliopin Wordissa, tehdä hakuja Googlessa tai saada autoillessa navigointiohjeita omalla kielellään. Entä mille kielille älypuhelinten vuorovaikutteisia yksityisavustajia kuten iPhonen Siriä jatkossa kehitetään?


Suomi riskijoukossa

Suomi on riskialttiiden kielten joukossa. Tähän joukkoon kuuluvat myös esimerkiksi baski, bulgaria, katalaani, kreikka, unkari ja puola.

Pahimmassa jamassa on suomenkielinen konekäännös. Sillä on heikko tai jopa olematon tuki. Puheenkäsittelyn tuki on kohtuullinen, ja suomenkielisen tekstin analyysilla sekä puhe- ja tekstiaineistojen saatavuudella on osittainen tuki.

Suomen kieltä käsittelevä julkaisu on juuri ilmestynyt. Se on ladattavissa täällä.


Kielten tulevaisuus uhattuna

– Tutkimuksemme tulokset ovat erittäin huolestuttavia. Suurin osa Euroopan kielistä on vakavasti aliresursoitu ja jotkut niistä lähes täysin laiminlyöty. Tästä näkökulmasta katsottuna monien kieltemme tulevaisuus ei ole lainkaan varma, toteaa professori Hans Uszkoreit, META-NET:in koordinaattori, Saksan tekoälyn tutkimuskeskuksen DFKI:n tutkimusjohtaja ja yksi tutkimusraportin toimittajista.

Raportin toinen toimittaja, tohtori Georg Rehm DFKI:stä toteaa, että erilaisten eurooppalaisten sovellusalojen ja kielten kieliteknologiatuen välillä on dramaattisia eroja.

– Tätä menoa 'suurten' ja 'pienten' kielten välillä ammottava teknologinen kuilu vieläpä levenee. Meidän on varmistettava, että myös pienemmillä ja aliresursoiduilla kielillä on tarvittava perusteknologia, muuten nämä kielet on tuomittu digitaaliseen sukupuuttoon.

META-NET

2013

2014

2013