Kuka olet?
Olen freelance-konsultti, -tutkija ja -ohjelmoija. Urani kieliteknologian parissa alkoi Helsingin yliopistolla
Mikä on työsi aihe?
Tällä hetkellä olen tekemässä sentimenttikorpusta eli kokoelmaa sosiaalisesta mediasta kerättyjä tekstinpätkiä, joiden tunneilmaisu (positiivinen, neutraali, negatiivinen) arvioidaan ihmisten toimesta. Näiden arvioiden pohjalta kehitetään myös automaattinen sentimenttitunnistin, joka on työkaluna itsessäänkin tarpeellinen ja jolla voidaan tulevaisuudessa annotoida uusissa aineistoissa ilmaistua tunnesävyä virke virkkeeltä.
Olen myös mukana
Miten Kielipankki liittyy tutkimukseesi?
Olen tehnyt monenlaista kehitystyötä suoraan Kielipankkia varten. Tällä hetkellä suunnitteilla on mm. ohjelmallinen rajapinta, jolla Kielipankin aineistoja voisi käyttää suoraan ohjelmakoodista. Nykyään kieliteknologisten työkalujen kehitys on yhä enemmän koneoppimisen yleisosaajien kiinnostuksen kohteena, ja monia kiinnostaa päästä käsiksi dataan – mitä enempään ja rikastetumpaan, sen parempi.
Kielipankin aineistoon liittyviä julkaisuja:
Käytimme E-Thesis -aineistoa, eli opinnäytetöitä,
- Hardwick, S., Enqvist, E. J., Onikki-Rantajääskö, T. A., & Linden, B.K. J. (2018). Tieteen kansallinen termipankki (TTP) ja tiedonlouhinnan apuneuvot. Posterin esittämispaikka: Kielitieteen päivät, Helsinki, Finland.
Olen julkaissut