next up previous contents index
Aliluvut


1.4 Annotointityökalut

Puheen annotointiin on olemassa monia työkaluja, joilla on erilaisia ominaisuuksia. Tämä ohjeistus soveltuu parhaiten annotointiin Puh-editori-nimisellä ohjelmalla. Annotaatiota voi kuitenkin tehdä myös muilla ohjelmilla, kunhan pitää mielessään tässä dokumentissa annetut ohjeet (ks. esim kuva 1.1). Tällöin annotaatiotiedostot voidaan automaattisesti muuntaa puhetietokantajärjestelmään sopiviksi.

Kuva 1.1: Esimerkki dialogin annotaatiosta Praat-ohjelmalla. Puhujien S1 ja S2 puheeseen liittyvät annotaatioyksiköt on merkitty eri kerroksiin. Topic-kerroksessa on vapaamuotoinen englanninkielinen kuvaus puheenaiheesta: tässä on menossa keskustelu vanhoista elokuvista.
Image jpgfigs/conv_ann_example.jpg


1.4.1 Annotointi Puh-editorilla

Puh-editori ohjaa käyttäjää noudattamaan ohjeita ja määrittelemään käyttämänsä annotaatioyksiköt tarkasti. Puh-editorissa voidaan annotoida lukuisia annotaatiokerroksia samanaikaisesti. Puh-editoria käyttämällä kaikki annotaatiot ovat suoraan yhteensopivia liitettäväksi puhetietokantaan, ja niitä voidaan myös helposti jakaa muiden tutkijoiden kanssa. Puh-editori voidaan asentaa tietokoneisiin, joissa on Windows- tai
Linux-käyttöjärjestelmä. Editorin voi ladata ilmaiseksi omalle koneelleen www-osoitteesta

http://www.csc.fi/kielipankki/puhe/index.phtml

Samassa paikassa on myös ohjelman käyttöopas.


1.4.2 Annotointi Praat-ohjelmalla

Jos käytät annotointiin Praat-ohjelmaa (5), kaikki tekemäsi annotaatiokerrokset (Tier) ovat fyysisesti täysin erillisiä. Eri kerroksissa olevien yksiköiden välisiä suhteita voi kuitenkin kuvata niiden mahdollisen ajallisen päällekkäisyyden avulla. Tätä tietoa voi Praatin sisällä hyödyntää vain skripteissä.

Praat-ohjelmalla tehdyt annotaatiotiedostot (TextGrid) on mahdollista muuntaa puhetietokannan käyttämään muotoon. Osoitteessa

http://www.csc.fi/kielipankki/puhe/index.phtml

on linkki ohjattuun konvertointi- ja julkaisutyökaluun (Publish TextGrid Web Wizard), joka muuntaa Kielipankin puheaineistoista tehdyt annotaatiotiedostot Puh-editorin ymmärtämään muotoon ja julkaisee annotaatiokerrokset. Tämä mahdollisuus kannattaa huomioida jo Praatilla annotoitaessa.


next up previous contents index
: II. Annotaatioyksiköt : 1. Mitä on annotaatio? : 1.3 Aineiston luomat rajoitukset   Sisältö   Hakemisto
Mietta Lennes 2005-05-11