Tämän haastattelun teksti on käännetty koneellisesti englannista suomeksi kunnianosoituksena kieliteknologian edistykselle.
Kuka olet?
Olen Filip Ginter, ja toimin Turun yliopiston kieliteknologian apulaisprofessorina. Olen tällä hetkellä myös TurkuNLP-tutkimusryhmän pitkäaikaisin jäsen. Olen koulutukseltani tietojenkäsittelytieteilijä, ja nautin syvästi niistä monista ainutlaatuisista haasteista, joita ihmiskieli asettaa.
Mihin tutkimuksesi keskittyy?
Koska minua ei ole siunattu kärsivällisyydellä eikä pitkällä keskittymiskyvyllä, olen vuosien varrella onnistunut paneutumaan melko moniin tutkimusaiheisiin TurkuNLP-ryhmän kanssa. Aloitimme tieteellisen kirjallisuuden louhinnan parissa, mutta sitten siirryimme yleisemmin erilaisten NLP-työkalujen ja -resurssien kehittämiseen. Olen aina pitänyt suomen kielestä ja päätin osallistua erityisesti suomalaisen NLP:n kehittämiseen, ehkäpä antaakseni takaisin yhteiskunnalle, joka niin anteliaasti isännöi minua väitöstutkimukseni aikana. Henkilökohtaisesti tärkein – tai ainakin näkyvin – yritykseni oli Turku Dependency Treebank, josta tuli myöhemmin yksi ensimmäisistä puupankeista supermenestyksekkäässä
Viime aikoina en tietenkään voinut olla hyppäämättä mukaan syväoppimisen tsunamiin. TurkuNLP:n aiempi työ suomalaisen internetin ryömimiseksi ja miljardien suomen kielen sanojen keräämiseksi kannatti, kun siitä tuli keskeinen osa
Entä miten tästä eteenpäin? Näen tavoitteenani tuoda suomen kieleen tavalla tai toisella suurin osa niistä työkaluista, tehtävistä ja resursseista, joita isommilla kielillä on. Ajattele kysymysten vastaamista, tiivistämistä, semanttista hakua, parafraasimalleja ja monia muita NLP-tehtäviä, joita ei vielä ole kunnolla katettu suomen kielessä. Jos ne ovat olemassa englannille, niiden pitäisi olla olemassa myös suomelle. Elämme jännittäviä aikoja NLP:ssä, ja nyt meillä on paljon enemmän mahdollisuuksia kuin vielä viisi vuotta sitten. Ja tietysti, kun
Näiden enemmän tai vähemmän valtavirran NLP-hankkeiden lisäksi minulla on ollut useita, rohkenen sanoa, onnistuneita yhteistyöhankkeita digitaalisten humanististen tieteiden alalla, erityisesti historioitsijoiden kanssa. Nautin näistä hankkeista, koska ne haastoivat meidät ratkaisemaan mielenkiintoisia teknisiä ja algoritmisia ongelmia.
Miten Kielipankki liittyy tutkimukseesi?
Ehkä näkyvin panokseni Kielipankkiin on
Olemme luonnollisesti käyttäneet Kielipankin resursseja laajasti täällä TurkuNLP:ssä, ehkä eniten
En voi korostaa, miten tärkeää suomalaiselle NLP:lle on, että me kaikki annamme avoimia tietokokonaisuuksia ja ilmaisia työkaluja ja malleja Kielipankkiin ja myös säilytämme etumatkaamme laskennallisten resurssien suhteen, mistä LUMI on täydellinen esimerkki.
Käännöksen teki:
Julkaisuja
J. Kanerva & F. Ginter & S. Pyysalo 2020.
J. Kanerva & F. Ginter & T. Salakoski 2020.
J. Kanerva & F. Ginter & N. Miekka & A. Leino & T. Salakoski 2018.
A. Vesanto & A. Nivala & T. Salakoski & H. Salmi & F. Ginter 2017.