next up previous contents index


II. Annotaatioyksiköt

Tutkijan ja annotoijan on hyvä huomata, että seuraavat yleisluonteiset annotaatioyksiköt on muodostettu ensisijaisesti niiden laajaa käyttöä ajatellen. Tarkoitus ei siis ole ollut juuttua lujasti mihinkään tiettyyn teoreettiseen viitekehykseen vaan antaa ohjeet siitä, kuinka puheaineistosta voidaan rajata usein käytettyjä yksiköitä ja piirteitä mahdollisimman yksiselitteisesti siten, että yksiköt soveltuvat tietokantajärjestelmään. On myös itsestään selvää, että kaikki yksiköt eivät sellaisenaan sovellu kaikkien aineistojen nimikointiin.1.6

Tutkijalle jää lopullinen vastuu siitä, ovatko näin syntyneestä tietokannasta tehdyt haut mielekkäitä ja siitä, kuinka hän itse yhdistelee erilaisia yksiköitä niin, että saa haluamansa tiedon esille. Mikään alla kuvatuista yksiköistä ei yksinään tuota kovin hyödyllistä tietokantaa, mutta kun samasta aineistosta on olemassa useita erityyppisiä annotaatiokerroksia -- mahdollisesti jopa monen eri annotoijan tekeminä -- on tietokannan rakenteessa paljon implisiittistä informaatiota, joka voidaan oikein rakennetuilla hakukriteereillä houkutella päivänvaloon. Näin myös eri alojen tutkijat voivat toimia paremmin yhteistyössä ja hyödyntää toistensa tietämystä....1.6
Tässä oppaassa kuvatut yksiköt ja niiden käyttöohjeet vastaavat Kielipankin julkaiseman RDF-skeeman http://www.csc.fi/kielipankki/puhe/schemas/official/annotation/coreUnits.rdfs sisältämiä määrittelyjä. Kielipankin tarjoama Puh-editori tukee kyseistä RDF-skeemaa ja ohjaa annotoijaa käyttämään oikein valmiiksi määriteltyjä perusyksiköitä. Tätä ohjeistoa ja annotaatioyksiköitä kannattaa kuitenkin soveltaa myös muilla ohjelmilla annotoitaessa.

Aliluvut
next up previous contents index
: 2. Kuinka annotaatioyksiköitä käytetään? : Annotaatio-opas : 1.4 Annotointityökalut   Sisältö   Hakemisto
Mietta Lennes 2005-05-11