Suomen fonetiikkaa: Suomen kielen perussanakirjan äännetilasto
Suomen fonetiikkaa / Sana ja sen äännerakenne / Äännetilastot / SPSK:n äännetilasto

 

Suomen kielen perussanakirjan
äännetilasto

Tilasto on laadittu Kotimaisten kielten tutkimuskeskuksen koostaman
elektronisen sanakirjaversion perusteella noudattaen tiettyjä
valintaperiaatteita
.

Äännetilaston valintaperiaatteet
Koko aineisto kirjain/äänne-vastaavuuden perusteella
Koko aineiston kvantiteettitilasto
Tilasto sanan ensimmäisen äänteen useudesta
Tilasto sanan kahden ensimmäisen äänteen useudesta
Tilasto sanan kolmen ensimmäisen äänteen useudesta
Tilasto sanan neljän ensimmäisen äänteen useudesta
Tilasto sanan viiden ensimmäisen äänteen useudesta
Sanojen pituustilasto

Suomen kielen äännetilastojen vertailu
Kvantiteettitilastojen vertailu

Huomautuksia

 

 

Koko aineisto kirjain/äänne-vastaavuuden perusteella

Kuva: Koko perussanakirjan äännemäärät

Sivun alkuun


Koko aineiston kvantiteettitilasto

Yhdyssanojen sananrajaisia nasaaliassimilaatioita ei ole merkitty. Lisäksi karsitussa sanakirjaotoksessa esiintyi 48 vierassanaa, joissa esiintyi suhu-s (). Näitä ei ole merkitty tilastoon.

Kuva: Perussanakirjan kvantiteettitilasto

Suomen kielen perussanakirjan elektronisen version perusteella laadittu äännetilasto (ks. sanaston valintaperiaatteet). Värilliset pylväät = lyhyt kvantiteetti (sika; mato), valkoiset pylväät = pitkä kvantiteetti (siika; matto). Tilastoinnissa pitkä kvantiteetti ilmaistiin suuraakkosen (esim.tt = T; matto = maTo) merkillä. Nasaaliassimilaatiot merkittiin myös yhdyssanojen osien rajoilla (aallon+murtaja = aallommurtaja). Näin syntyneitä kahden konsonantin jonoja (-mm-) ei kuitenkaan tilastoitu pitkän kvantiteetin tilastoihin. Pitkän kvantiteetin tilastot: ks. Kvantiteettitilastojen vertailu.

Sivun alkuun


Tilasto sanan ensimmäisen äänteen useudesta

Tilasto on laadittu sanamateriaalista,jossa kvantiteetti on merkitty (esim.tt = T; matto = maTo; aamu = Amu). Tilastosta voi siten nähdä esimerkiksi, kuinka usein sana alkaa pitkällä vokaalilla. Ks.viiden ensimmäisen äänteen tilasto.
Huomautuksia tilastoista

Kuva: Sanan ensimmäinen äänne perussanakirjassa

Sivun alkuun


Tilasto sanan kahden ensimmäisen äänteen useudesta

Kuva: Sanan 2 ensimmäistä äännettä perussanakirjassa

Sivun alkuun


Tilasto sanan kolmen ensimmäisen äänteen useudesta

Kuva: Sanan 3 ensimmäistä äännettä perussanakirjassa

Sivun alkuun


Tilasto sanan neljän ensimmäisen äänteen useudesta

Kuva: Sanan 4 ensimmäistä äännettä perussanakirjassa

Sivun alkuun


Tilasto sanan viiden ensimmäisen äänteen useudesta

Kuva: Sanan 5 ensimmäistä äännettä perussanakirjassa

Sivun alkuun


Sanojen pituustilasto

Kuva: Sanojen pituustilasto

Sivun alkuun


 

Sanaston valintaperiaatteet

Suomen kielen perussanaston äännetilasto perustuu Kotimaisten kielten tutkimuskeskuksen ylläpitämään Suomen kielen perussanakirjan (SPSK) vuosina 1990-94 ilmestyneeseen sähköiseen hakusanastoon. Se käsittää noin 100.000 sanaa. Yleiskielen äännetilaston laskemista ja muuta tiedon hakua varten muodostettiin kaksi karsittua sanastoa, jolloin kokonaissanamääräksi tuli runsaat 90.000 sanaa. Tutkittavan sanaston laadinta tehtiin seuraavin periaattein:

  1. Päätavoitteena oli saada aikaan sanasto, joka kuvaa puhuttua yleiskieltä siten, että oikeinkirjoitus vastaa tietyin varauksin normatiivista ääntämistä. Näin ollen vierassanat, joissa on <c, q, w, z, x, å>, sivuutettiin, samoin sanat, joissa oikeinkirjoitus ei muutoin vastaa ääntämistä. Erisnimet poistettiin, koska niitä ei SPSK:ssa ole systemaattisesti muutenkaan esillä. Periaatteet esitellään yksityiskohtaisemmin alempana.
  2. Nasaaliassimilaatioiden käsittelyssä on erotettava sanansisäiset ja sananrajaiset tapaukset. Muodostettiin sanasto, jossa sanansisäiset assimilaatiot <nk> = {k} ja <ng> = {} (penger, sittenkin) tai <ng> = {} (singlaus, pingviini, gangsteri) merkittiin. Merkinnässä käytettiin isoja kirjaimia: <nk> = Nk, <ng> = NN tai <ng> = N. Jäljelle jääneet sananrajaiset potentiaaliset assimilaatiot (kuun+kierto, kuun+pimennys, kuun+maisema, puhelin+gallup) jätettiin merkitsemättä, koska huolitellussa artikulaatiossa sananloppuinen <n> voidaan ääntää. Kvantiteetti ja diftongit jäivät oikeinkirjoitusasuun. Ensimmäinen tilastoesitys koskee tätä sanastoa.
  3. Muodostettiin toinen, foneettisempi sanasto, jossa sananrajaiset assimilaatiot on merkitty (<-n+k-> = -Nk-, <-n+p-> = -mp-, <-n+m-> = -mm-, <-n+g-> = -Ng-) ja jossa pitkä kvantiteetti on erikseen merkitty tilastointia varten (pika/piika = pika/pIka; mato/matto = mato/maTo). Assimilaation tuloksena syntynyttä mm-tapausta (kuun+maisema) ei pidetty pitkänä kvantiteettina, jonka merkintä oli siis M. Pitkä alveolaarinen nasaali (kunnas) merkittiin eri tavoin kuin velaarinasaali (kangas).

Sivun alkuun

Sanaston karsinnassa kiinnitettiin huomiota seuraaviin tapauksiin:

Sivun alkuun

Haku:

Yhdistely: Muoto:

Lajittelu: