next up previous contents index


1. Mitä on annotaatio?

Annotointi eli nimikointi on puhe- tai muun aineiston kuvaamista, luokittelua ja jäsentelyä systemaattisella tavalla. Digitaalisesti tallennettu puhenäyte nimikoidaan yleensä jollakin tähän tarkoitukseen kehitetyllä tietokoneohjelmalla (esim. Praat, Puh-editori, CLAN, Anvil). Tämä annotaatio-oppaan osa kannattaa lukea ensin, jos ei ole aikaisemmin nimikoinut l. annotoinut puheaineistoa.1.1

Nimikoinnilla (engl. labeling) eli annotoinnilla (annotation > to annotate) tarkoitetaan sitä, että digitaalisesti tallennettuun puhenäytteeseen liitetään systemaattisesti nimikkeitä (labels) eli annotaatioita (annotations) eli symbolisia kuvauksia näytteen sisällöstä. Nimikoitavan ääni- tai videonäytteen on oltava digitaalisessa muodossa ts. yhtenä tai useampana tiedostona esim. tietokoneen kovalevyllä tai erityyppisillä levykkeillä.1.2 Alkuperäistä tallennetta, esim. ääni- tai videotiedostoa, jota annotaation avulla kuvataan, kutsutaan tässä yhteydessä signaaliksi. Jos kuvataan ääneen luettua, kirjoitettua tekstiä, annotoitava signaali on aina puhesignaali.

Nimikoinnissa annotaatiot on sidottava ääni- tai videonäytteen aikaulottuvuuteen. Tämän tavoitteen saavuttamiseksi näytettä kuunnellaan ja/tai katsellaan ja siitä piirrettyjä analyysikuvia tarkastellaan nimikointiin tarkoitetulla ohjelmalla. Kuuntelun ja katselun perusteella luodaan ääni- ja/tai videonäytteen "pariksi" tai laajennukseksi nimikointitiedosto, joka sisältää näytteen kuvaukset. Tätä varten näyte yleensä segmentoidaan: siitä rajataan halutulla tarkkuudella segmenttejä (ääni- tai videopätkiä, joilla on määrätty alku- ja loppupiste sekä ajallinen kesto; engl. segment). Segmenteille voidaan sitten antaa nimiä eli nimikoida ne. Myös näytteen tietyille yksittäisille ajanhetkille (aikapisteille, engl. time point) voidaan antaa nimiä (näin syntyy ns. ankkureita, engl. anchor). Nimikoinnin tarkoituksena on muodostaa "maamerkkejä", joiden perusteella alkuperäisestä puhesignaalista voidaan löytää halutut osat ja kohdistaa niihin vaikkapa akustisia analyyseja tai muita toimenpiteitä. Nimikointi on välttämätöntä, jos halutaan hallita ja hyödyntää suurta määrää puheaineistoa.

Pelkkä ääninäytteen litterointi esimerkiksi tekstitiedostoon ei siis vielä ole nimikoimista, koska siinä litteraatin eri osia ei kytketä ääninäytteen vastaaviin ajallisiin kohtiin. Kannattaa huomata, että litteraatti tai mikä tahansa muu transkriptio on aina tulkinta alkuperäisestä aineistosta. Siksi pelkän litteraatin avulla ei pitäisi koskaan tutkia puhetta -- vaarana on, että tulee pikemminkin tutkineeksi litteroijan näkemystä, joka on vieläpä kuvattu kirjoitetulla kielellä! Käyttämällä nimikointia aineiston kuvausmenetelmänä varmistetaan mahdollisimman suora ja tarkka yhteys alkuperäiseen puhetallenteeseen, jolloin tutkijalla ja tutkimuksen arvioijalla on mahdollisuus tarkistaa ja korjailla puheesta luotuja kuvauksia.

Annotaatiotyylejä on erilaisia ja tutkija voi kehittää oman annotaatiotavan sen mukaan, minkälaisista puheen ilmiöistä on kiinnostunut. Annotaatio voi olla esimerkiksi ortografinen ts. oikeinkirjoitusta noudattava litteraatti (engl. yl. transliteration, transcript)1.3, morfologisten yksiköiden kuvaus, prosodisten piirteiden kuvaus tai vaikkapa foneettinen transkriptio puheesta. Ensin mainitussa tapauksessa segmenttirajat voivat olla vaikkapa yksittäisten sanojen tai lauseiden välillä, kun taas foneettista tutkimusta varten rajataan usein yksittäisiä äänteitä.

Jos erilaisia puheen yksiköitä halutaan käyttää hyödyksi yhdessä, voidaan luoda useita annotaatio- tai nimikointikerroksia tai -tasoja: yhdelle merkitään esimerkiksi äänteiden rajat, toiselle sanojen rajat, kolmannelle lauserajat jne. Samalla tallenteella voi myös olla useita rinnakkaisia annotaatioita: eri tutkijat voivat annotoida saman aineiston kukin oman näkemyksensä mukaisesti.

Automaattisia segmentointi- ja nimikointimenetelmiä yritetään jatkuvasti kehittää eri puolilla maailmaa. Toistaiseksi tarkimman nimikoinnin saa kuitenkin aikaan ihminen, sillä puheen nimikointi vaatii monenlaisten kielellisten tulkintojen tekemistä. Samasta syystä voidaan todeta myös, että sekä puheen litterointi, transkriptio että nimikointi ovat aina jossakin määrin subjektiivisia tuotoksia: niiden tarkkuus ja johdonmukaisuus riippuvat nimikoijan intresseistä, tiedoista, taidoista ja teoreettisesta näkemyksestä....1.1
Lisätietoa puhekorpusten tuottamisesta ja eri korpuksissa käytetyistä annotaatiotavoista löytyy esim. teoksesta The Production of Speech Corpora (22).
...1.2
Myös erilaiset kirjoitetun tekstin joukkoon lisätyt tagit (tag) ovat annotaatioita. Tällöin aikaulottuvuutta vastaa tekstin lineaarinen rakenne (merkkien sijainti tekstin alkuun nähden) ja ääninäytteen segmenttiä vastaa jokin tekstin osa, jonka ympärille tagit on merkitty. Tässä oppaassa käsitellään kuitenkin ainoastaan puheaineiston annotaatiota.
...1.3
Huom. suomessa käsite translitteraatio tarkoittaa lähinnä tietyn kielen kirjoitusasun muuntamista merkkijärjestelmästä toiseen, esim. venäjänkielisen kirjoituksen kyrillisten aakkosten muuntamista latinalaiselle aakkostolle. Translitteraatio ei siis ole aivan sama asia kuin litteraatio, jossa puhetta ''kirjainnetaan''.

Aliluvut
next up previous contents index
: 1.1 Miksi puhetta nimikoidaan : I. Puheen annotaatio : I. Puheen annotaatio   Sisältö   Hakemisto
Mietta Lennes 2005-05-11