Antti Nevanlinna
28.2.2010
Spss for Windows
-
Ohjelman
versiot
-
Suomenkieliset
oppaat
-
Suomenkielisiä
WWW:stä löytyviä oppaita
-
Ohjelman
ikkunat
-
Ohjelman
käyttötavat
-
Havaintotiedoston
rakenne
-
Havaintotiedoston
muodostus
-
Muuttujien
määrittely ja aineiston syöttö
-
Excel-taulun
siirto SPSS-havaintotiedostoksi
-
Muuttujien
keskiarvot, keskihajonnat, minimit ja maksimit
-
Diskreetin
muuttujan jakauma
-
Jatkuvan
muuttujan jakauma
-
Ristiintaulukot
-
Korrelaatiokerroin
-
Tulostaulukoiden
muokkaus
-
Compute-muunnos
-
Recode-muunnos
-
Automatic
Recode
-
Yleinen
ehdollinen muunnos
-
Visual
Binning
-
Havaintojen
valinta
-
Analyysit
kaikille osa-aineistoille
-
Havaintojen
järjestäminen. Sorttaus
-
Aggregointi
-
Havaintotiedostojen
yhdistäminen
-
Muuttujan
tai havainnon poistaminen
-
Muuttujan
lisääminen tai siirtäminen toiseen paikkaan
-
T-testi
-
Yksisuuntainen
varianssianalyysi
-
Kaksi-
ja kolmiulotteiset pisteistöt (Scatter)
-
Kuvaeditori
-
Pylväskuviot
-
Kuvatemplate
-
Interaktiivisen
grafiikan kuvaeditori
-
Interaktiisen
grafiikan syntaksi
1. Johdanto
1.1 Ohjelman versiot ja hankinta
Ohjelmasta on yliopiston atk-ympäristössä
käytössä useampia versioita:
-
13.0 Toimii Windows/98/ME/2000/XP-koneissa
(ei NT). Vaatii vähintään 128 megatavua keskusmuistia.
-
14.0 ""
-
15.0 Toimii Windows/2000, Windows/XP
-alustoilla (Vista puutteellisesti). Vaatii vähintään 256
megatavua keskusmuistia.
-
16.0 Windows/XP, Windows/Vista,
Linux ja MacOS. Vaatii vähintään 512 megatavua keskusmuistia.
( tarkemmat tiedot)
-
17.0 Windows/XP, Windows/Vista,
Linux ja MacOS. Vaatii vähintään 512 megatavua keskusmuistia.
Suositellaan vähintään 1 gigatavua.
(tarkemmat tiedot)
-
18.0 Microsoft Windows XP (Professional,
32-bit) or Vista® (32-bit or 64-bit), Windows 7. Linux ja MacOS. Suositellaan
vähintään 1 gigatavua keskusmuistia. (Tarkemmat
tiedot)
Ohjelman hankinta:
Helpointa (ja halvinta) on ladata ohjelma tietotekniikka-osaston ohjelmistojakelun
sivulta ohjelmistojakelu.helsinki.fi.
Lataaminen vaatii yliopiston käyttäjätunnuksen (ns. pääkäyttäjätunnus).
Ohjelmistojakelun sivulta saa myös haettua tarvittavan aktivointikoodin
sekä asennusohjeet.
1.2 Suomenkieliset oppaat
Hyviä oppaita esim. seuraavat:
- SPSS-perusteet 15.0
Tekijä Leila Karjalainen
(tilaaminen, kts. http://www.pii-kirjat.fi/spss15.html)
- SPSS 15 for Windows: Perusteet
Rasi, Ilkka, Lepola, Esa, Muhli, Arto, Kanniainen, Aila
Kustantaja: Oulun Yliopisto.
- SPSS for Windows menetelmiä
Ilkka Rasi; Aila Kanniainen;
Oulun Yliopisto, 2007
1.3 WWW:stä
löytyviä oppaita
WWW:stä löytyy hyviä SPSS-oppaita (suomenkielisinäkin).
Esim. seuraavat:
- Helsingin yliopiston valtiotieteellisen SPSS-kursseilla käytettyjä
oppaita. Tekijänä Maarit Valtari löytyvät osoitteesta:
http://www.valt.helsinki.fi/blogs/valtari/
- Menetelmäopetuksen valtakunnallinen tietovaranto, http://www.fsd.uta.fi/menetelmaopetus/intro.html
sisältää SPSS-oppimisympäristö -osan.
Englanninkielisiä web-oppaita löytää
- esimerkisi Lancasterin yliopiston sivulta:
http://www.cas.lancs.ac.uk/short_courses/intro_spss.html
http://www.cas.lancs.ac.uk/short_courses/intro_spss.html
- erittäin hyvä
sivusto (myös) SPSS-ohjelmistosta löytyy UCLA:n Statistical Computing
-sivustosta:
http://www.ats.ucla.edu/stat/
Kattava luettelo englanninkielisistä oppaista on koottu sivulle:
http://pages.infinit.net/rlevesqu/spss.htm
Manuaalit
Ohjelman käsikirjat on julkaistu pdf-muodossa ja saatavissa (= vapaasti
ladattavissa) meidän ohjelmistojakelun sivulta, hakemistosta
SPSS/PASW 18 iso-tiedona PASW18_DOCS.ISO. Käsikirjoja ei välttämättä
tarvita, mutta esimerkiksi kuvien teossa niistä voi olla apua. Erityisen
hyödyllisiä manuaaleja ovat
SPSS Statistics 18.0 Brief Guide
(kuvien muokkaus) sekä PASW Statistics Base 18 (tulostaulukoiden
muokkaus).
1.4 Ohjelman ikkunat
SPSS Windows sisältää 3 eri tyyppistä ikkunaa.
-
Data -ikkuna
-
Output -ikkuna
-
Syntax-ikkuna
Kun ohjelman aloittaa, avautuu (ainakin) Data -ikkuna. Data-ikkunaan voidaan
syöttää havaintoaineisto tai ikkunaan voidaan avata valmiiksi
havaintotiedostoksi talletettu aineistotiedosto. 14-versiosta alkaen SPSS-ohjelma
voi sisältää useita Data-ikkunoita.
Output-ikkunaan ilmeistyvät analyysien tulokset sekä kuvat.
Syntax-ikkunaan kirjoitetaan komennot, mikäli käytetään
komentopohjaista työskentelytapaa. Syntax-ikkunan käyttö
ts. komentojen käyttö ei ole välttämätöntä.
Output- sekä syntax-ikkunoita voi olla useampia.
1.5 Ohjelman käyttötavat
Valikkomuotoinen käyttötapa
Data-ikkunan yläpuolella ovat valikot, joista käyttäjä
valitsee halutun toimenpiteen. Valintojen jälkeen avautuu lomake,
joka täytetään. Tämän jälkeen klikataan
lomakkeen OK-painiketta.
Esimerkiksi ohjelmiston mukana tulevan harjoitusdatan Employee data.sav
muuttujan
GENDER
prosenttijakauman saa tehtyä seuraavasti:
-
Avataan aineistotiedosto Data-ikkunaan valitsemalla Data ikkunan yläpuolelta
löytyvästä File-valikosta: Open > Data ja kaksoisklikataan
k.o. tiedostoa
-
Valitaan Data editor-ikkunan yläpuolelta Analyze-valikko.
-
Valitaan Analyze-valikosta vaihtoehto Descriptive Statistics > Frequencies
Avautuu Frequencies-niminen lomake.
Aineiston muuttujat esiintyvät lomakkeen vasemmanpuoleisessa laatikossa.
Tästä valitaan hiirellä muuttuja GENDER. Klikkaamalla
nuolta muuttuja siirtyy Variables-laatikkoon. Tämän jälkeen
OK-painikkeesta saadaan analyysi suoritettua.
Tulos ilmestyy Output-ikkunaan:
Komentopohjainen käyttötapa
Ohjelmaa voi käyttää myös syntaksimuotoisesti.
Komennot
kirjoitetaan (tai avataan) syntax-ikkunaan. Esimerkiksi edellinen tehtävä
voitaisiin tehdä myös seuraavasti:
-
Avataan Syntax-ikkuna (jos ei vielä avoinna) valitsemalla File-valikosta
New > Syntax.
-
Kirjoitetaan ikkunaan seuraava ajovirta:
FREQUENCIES
VARIABLES=gender
/ORDER= ANALYSIS .
-
Suoritetaan komento maalaamalla se ja valitsemalla tämän jälkeen
Syntax-ikkunan Run-valikosta vaihtoehto: Selection.
Lomakkeet + syntaksi
Lomake-käyttömuodon ja komentojen käytön voi yhdistää
tekemällä lomakkeella komennon pohjan. Tämä tehdään
siten, että ensin täytetään normaaliin tapaan
lomake, mutta OK-painikkeen sijasta klikataankin Paste-painiketta. Tämä
siirtää generoidun komennon syntax-ikkunaan, josta se voidaan
suorittaa.
2. Aineisto havaintotiedostoksi
2.1 Havaintotiedoston rakenne
SPSS-havaintotiedosto koostuu riveistä ja sarakkeista. Yksi rivi vastaa
yhden tapauksen tietoja (esim. henkilön vastauksia) ja yksi sarake
yhteen kysymykseen annettuja vastauksia. Ohjelmistoon sisältyvä
esimerkkitiedosto Employee data.sav näyttää Data
editor -ikkunassa tällaiselta:
Ensimmäinen muuttuja ID ilmaisee henkilön numeron,
GENDER sukupuolen, BDATE henkilön syntymäajan. Muuttujan nimi
esiintyy siis sarakkeen otsikkona. Muuttujan tyyppi voi olla esimerkiksi:
-
numeerinen (esim ID)
-
teksti (esim. GENDER)
-
päiväys (esim BDATE)
2.2 Havaintotiedoston muodostaminen
SPSS osaa käsitellä vain aineistoja, jotka tavalla tai toisella
on saatu Data editor-ikkunaan. Esimerkiksi
-
avaamalla valmiiksi talletettu SPSS-havaintotiedosto
-
syöttämällä aineisto tyhjään Data-ikkunaan.
Mikäli aineisto syötetään suoraan Data-ikkunaan, kannattaa
se lopuksi tallettaa havaintotiedostoksi, jolloin jatkossa aineiston saa
avattua Data-ikkunaan File-valikon Open-vaihtoehdon kautta.
SPSS osaa avata myös muita kuin SPSS-tiedostoja. Tällöinkin
kannattaa kuitenkin tallettaa aineisto SPSS-muotoon.
2.3 Muuttujien
määrittely ja aineiston syöttö
Muuttujan määritykseen sisältyvät esimerkiksi
seuraavat ominaisuudet:
-
Nimi
-
Tyyppi
-
Nimen selitys (Variable label) sekä arvojen selitykset (Value label)
-
(Mahdollinen) puuttuvan tiedon koodi
-
Mittaustaso (Measure)
Versiosta 10 alkaen muuttujan määrittely annetaan Data-ikkunan
alaosasta löytyvän Variable View -painikkeen kautta.
Klikkaamalla k.o. painiketta avautuu näkymä:
Muuttujat määritellään yksi kerrallaan siten, että
ensimmäiselle riville kirjoitetaan ensimmäisen muuttujan tiedot,
toiselle riville toisen jne. Muuttujat tallettuvat havaintotiedostoon annetussa
järjestyksessä.
Nimi
Muuttujan nimi kirjoitetaan taulukon Name-sarakkeeseen. Nimi sai olla vain
8 merkkiä pitkä aina 11-versioon asti. 12-versiosta lähtien
muuttujan nimi voi olla jopa 64 merkkiä pitkä. Voi kuitenkin
olla hyvä käyttää edelleen lyhyitä muuttujan nimiä,
jotta havaintotiedoston siirto toiselle tilasto-ohjelmistolle kävisi
päinsä. Samaten ja samasta syystä voi olla järkevää
on välttää skandeja, ts. kirjaimia Ä,Ö,Å,
vaikka SPSS hyväksyykin ne. Vaikka SPSS-muuttujan nimi voi olla suurin
piirtein millainen hyvänsä, nimi ei kuitenkaan saa alkaa numerolla
eikä se saa sisältää välilyöntiä.
Tyyppi
Suositeltavat muuttujan tyypit ovat numeric, string ja date.
-
Mikäli muuttuja saa vain numeraalisia arvoja, tulee valita numeric.
-
Jos muuttuja saa (myös) tekstiarvoja, tulee valita string. Tällöin
vielä tulee valita muuttujan maksimileveys (width) niin suureksi,
että kaikki tekstiarvot mahtuvat k.o. kenttään. SPSS-tekstimuuttujan
arvon maksimipituus on 15-versiossa jo 32767 merkkiä. Vanhoissa versioissa
oli vielä tekstimuuttujan leveys rajoitettu vain 255 merkkiin, joka
oleellisesti hankaloitti avointen tekstivastausten tallennusta.
-
Mikäli muuttujan arvot ovat päiväyksiä, niin tyypiksi
kannattaa valita Date. Valittavana on useita päiväysformaatteja:
Label
Label-sarakkeeseen tallennetaan muuttujan nimen selitys. Nimen selitystä
ei
ole pakko antaa. (Jos sen jättää tekemättä, niin
ohjelma käyttää nimen selityksenä itse nimeä.)
Hyvä tapa on ehkä kuitenkin antaa varsinaisille kysymys-muuttujille
yksinkertaiset nimet, esim. k1,k2,k3 jne ja lisätä kysymyksen
varsinainen sisältö muuttujan nimen selitykseksi. Nimen selitystä
eivät rajoita muuttujan nimeen sisältyvät rajoitteet. Se
voi siis sisältää aivan hyvin välilyöntejä
ja päin vastoin kuin muuttujan nimi, on se myös case-sensitiivinen.
15-versiossa nimen selitys voi olla aina 255 merkkiä pitkä.
Values
Muuttujan nimen selityksen lisäksi muuttujien arvoille voidaan antaa
selitykset. Kategorisille muuttujille, s.o. muuttujille, joiden arvo ilmaisee
sen, mihin luokkaan havaintoarvo kuuluu, on syytä antaa arvoselitykset.
Tavallinen ja hyvä tapa on tallettaa kategorinen muuttuja numeeroarvoin,
ja lisätä sitten numeroarvoihin arvoselitykset. Arvoselitykset
kirjoitetaan Values-sarakkeeseen kaksoisklikkaamalla ensin kyseistä
solua. Tällöin avautuu lomake:
Arvoselitykset annetaan siten, että ensin kirjoitetaan numeroarvo
Value-kohtaan
ja tämän jälkeen kyseistä arvoa vastaava selitys Label-kohtaan..
Kun yhdelle arvolle on annettu tällä tavoin selitysteksti, klikataan
Add-painiketta. Tällä tavalla annetaan kaikille arvoille arvoselitys.
Lopuksi OK-painikkeen kautta arvoselitys tallentuu kyseisen muuttujan kohdalle.
Puuttuvan tiedon koodi
Tämä tulee täyttää vain, jos esim. koodilla 9
on merkitty puuttuvaa tietoa - tällöin numero 9 tulee
määritellä puuttuvan tiedon koodiksi. Mikäli datan
syötössä solu jätetään tyhjäksi,
ymmärtää ohjelma sen joka tapauksessa puuttuvaksi.
määreet jää pysyväksi.
Mittaustaso (Measure)
Muuttujan mittaustaso annetaan Measure-sarakkeella. Vaihtoehdot ovat Scale,
Ordinal ja Nominal. Tilastotieteen teorian (ja soveltamisenkin) kannalta
muuttujan mittaustaso on erittäin tärkeä, vaan ohjelma ei
juuri käytä tätä tietoa. Tällä tiedolla on
merkitystä lähinnä vain ns. interaktiivisessa grafiikassa.
Muuttujamääritysten tarkistus
Muuttujamääritykset voi tulostaa valinnoilla: File > Display
Data File Information > Working File
[Working File tarkoittaa SPSS-terminilogiassa Data ikkunassa olevaa
aineistoa.]
Tyhjän havaintotiedoston talletus
Jos määritykset ovat kunnossa, kannattaa Data-ikkuna tallettaa:
FILE > SAVE AS. Avautuvaan lomakkeeseen kirjoitetaan talletettavan havaintotiedoston
nimi (ja valitaan hakemisto, johon tiedosto tallettuu.)
Aineiston syöttäminen
Aineisto syötetään (tavallisesti) havainto eli rivi kerrallaan.
Tabulaattori- tai nuoli-näppäin siirtävät kursoria
yhden askeleen oikealle, kun taas enter-näppäin siirtää
askeleen alaspäin. Yhden rivin voi syöttää kätevästi
maalaamalla se ensin klikkaamalla rivinumeroa. Tämän jälkeen
enter-näppäin siirtääkin askeleen oikealle, joten tällöin
sitä voi käyttää.
Muutaman havainnon eli rivin syöttämisen jälkeen kannattaa
Data-ikkuna tallettaa. Ohjelma ei nimittäin sisällä automaattista
tallennusta, joten ohjelman kaatuessa tallettamaton data menetetään.
Syötettyjen havaintoarvojen tarkistaminen
-
Analyze > Descriptives Statistics > Descriptives tai
-
Analyze > Descriptives Statistics > Frequencies
2.4 Excel-tiedoston
siirto SPSS-havaintotiedostoksi
1. Yksinkertaisinta on
-
avata Excel-tiedosto valinnoilla: FILE > OPEN > DATA
-
määritellään tiedoston tyypiksi Excel
-
jos Excel-taulun ensimmäisellä rivillä on annettu sarakkeiden
nimet ruksataan kohta Read variable names
Kun taulu on saatu avattua Data editor-ikkunaan, kannattaa se tallettaa
SPSS-tiedostoksi.
Jos tiedosto sisältää useita tauluja, osaa ohjelma kysyä
avattavaa taulua (ts. vain yksi taulu voidaan avata kerrallaan).
2. Toinen vaihtoehto on valinta: File > Open Database > New Query
Tämä tie on kuitenkin monimutkaisempi kuin tapa 1.
Harjoitustehtäviä
Seuraavassa on kuva havaintotiedostosta, jossa on kolme havaintoa ja viisi
muuttujaa:
Havaintotiedoston rakenne on seuraava:
List of variables on the working file
Name
Position
ID Employee Code
1
Measurement
Level: Scale
Column Width:
5 Alignment: Right
Print Format:
F4
Write Format:
F4
BDATE Date of Birth
2
Measurement
Level: Scale
Column Width:
10 Alignment: Right
Print Format:
EDATE10
Write Format:
EDATE10
JOBCAT Employment Category
3
Measurement
Level: Ordinal
Column Width:
8 Alignment: Right
Print Format:
F1
Write Format:
F1
Missing
Values: 0
Value
Label
1 Clerical
2 Custodial
3 Manager
SALARY Current Salary
4
Measurement
Level: Scale
Column Width:
8 Alignment: Right
Print Format:
F7.2
Write Format:
F7.2
Missing
Values: .00
SEX Gender
5
Measurement
Level: Nominal
Column Width:
8 Alignment: Right
Print Format:
F1
Write Format:
F1
Value
Label
1 Female
2 Male
1. Määrittele muuttujat eli anna muuttujille nimi, tarvittaessa
tyyppi,
nimen selitys sekä tarvittaessa arvoselitys.
2. Talleta tyhjä aineisto tiedostoksi r:\pohja.sav
3. Tarkista muuttujamääritykset valinnalla Utilities > File
Info
4. Syötä havaintotiedoston arvot ts. nuo kolme havaintoa
5. Talleta havaintoaineisto SPSS-havaintotiedostoksi r:\bank2.sav
6. Tarkista syötetyt arvot.
3. Kuvailevat analyysit
3. 1 Muuttujien
keskiarvot, keskihajonnat, minimit ja maksimit
Valitsemalla Analyze > Descriptive Statistics > Descriptive aukeaa lomake:
Oletusarvoisesti muuttujista lasketaan:
-
keskiarvo
-
keskihajonta
-
minimi
-
maksimi
Options-painikkeen kautta voidaan valita muitakin tunnuslukuja:
Samaten muutujien tulostusjärjestystä voi vaihtaa
Options-painikkeen avulla. Seuraavassa on tulostettu muuttujien AGE
ja TIME tunnusluvut:
3.2 Diskreetin muuttujan
jakauma
Mikäli muuttuja saa vain muutaman eri arvon, voidaan sen frekvenssi
eli prosenttijakauma tulostaa valinnoilla ANALYZE > DESCRIPTIVE STATISTICS
> FREQUENCIES:
Avautuvasta lomakkeesta valitaan muuttujat, joista jakauma halutaan
tulostaa. Charts-painikkeen kautta saadaan tulostettua muutujan
histogrammi (tai pylväsdiagrammi).
3.3 Jatkuvan muuttujan jakauma
Jatkuvan muuttujan jakaumaa kannattaa tarkastella Explore-vaihtoehdon avulla
valitsemalla Analyze > Descriptive Statistics > Explore. Avautuvasta lomakkeesta
päästään tulostamaan sekä useita tunnuslukuja
(mm. mediaani, moodi, kvartiileja) sekä erityyppisiä jakaumakuvia
mm.
boxplot-esitys sekä stem-leaf-kuva:
Dependent-laatikkoon valitaan tutkittava jatkuva muuttuja ja
Factor
List-laatikkoon voidaan valita luokkamuuttuja(t), jonka määräämissä
luokissa halutaan tutkia testimuuttujan jakaumaa.
3.4 Ristiintaulukot
Kahden luokitteluasteikollisen (nominaalisen) muuttujan riippuvuutta voidaan
tutkia muodostamalla ristiintaulukko. Toinen muuttujista valitaan
rivimuuttujaksi
ja toinen sarakemuuttujaksi.
Ristiintaulukko saadaan aikaan valinnoilla: Analyze > Descriptive Statistics
> Crosstabs. Avautuu lomake:
Rivimuuttuja(t) sijoitetaan Row(s)-laatikkoon ja sarakemuuttujat Column(s)-laatikkoon.
Kukin rivimuuttuja taulukoidaan jokaisen sarakemuuttujan kanssa, joten
jos vaikkapa rivimuuttujia on 4 ja sarakemuuttujia 6, on tuloksena 4*6
= 24 taulukkoa.
Oletusarvoisesti kuhunkin ristiintaulukon soluun tulostuu pelkästään
k.o. soluun kuuluvien havaintojen lukumäärä. Cells-painikkeen
kautta päästään lomakkeeseen, josta voidaan valita
esim. riviprosentit.
Statistics-painikkeen kautta, ruksaamalla Chi-quare-kohta, saadaan
taulukkoon liitettyä khi-neliö-testi, joka testaa
rivi- ja sarakemuuttujien riippumattomuuden.
3.5 Korrelaatiokerroin
Kahden jatkuvan s.o. intervalliasteikollisen muuttujan (lineaarisen) riippuvuuden
astetta kuvaa korrelaatiokerroin. SPSS tulostaa korrelaatiokertoimen valinnoilla
Analyze > Correlate > Bivariate:
Muuttujat, joiden väliltä halutaan laskea korrelaatiokerroin,
valitaan Variables-laatikkoon. SPSS tulostaa kaikkien muuttujaparien
välisen korrelaation eli koko korrelaatiomatriisin:
Kussakin solussa on ylimpänä itse korrelaatiokerroin. Tämän
alla on testi nolla-hypoteesille: k.o. korrelaatiokerroin = 0. Alimpana
on niiden havaintojen lukumäärä, josta k.o. korrelaatiokerroin
on laskettu.
4. Tulostaulukot
Analyysien tulokset ilmestyvät Output-ikkunaan. Seuraavassa teemme
havaintoaineiston Employee data.sav muuttujan MINORITY frekvenssijakauman
valinnoilla: Analyze > Descriptive Statistics > Frequencies (ja valitsemalla
sitten MINORITY-muuttujan tulostettavaksi muuttujaksi). Taulukko ilmestyy
OUTPUT-ikkunaan:
Output-ikkuna jakaantuu kahteen osaan. Vasempaan tulostuu tulostusten
sisällysluettelo ja itse tulostaulukot ilmestyvät output-ikkunan
oikeanpuoleiseen osaan.
4.1 Tulostaulukoiden muokkaus
Tulostaulukkoa päästään muokkaamaan kaksoisklikkaamalla
sitä. Muokkaustilassa taulukon ympärille piirtyy 'risuaita':
Samalla Output-ikkunan yläpuolelle ilmestyvät Pivot- sekä
Format-valikot, joita käyttäen saamme tulostaulukkoa muokattua.
Seuraavassa joitakin tavallisimpia operaatiota.
Desimaalien määrän vaihto
Mustataan se osa taulukkoa, jonka desimaalimäärään
halutaan tehdä muutos:
Tämän jälkeen valitaan Format-valikosta Cell Properties
ja edelleen Format Value -välilehti. Avautuu lomake:
josta voidaan sekä lisätä että vähentää
desimaalien määrää. Seuraavassa asetimme desimaalien
määrän 0:aan:
Huom: Ohjelma ei tarkista, summautuvatko esimerkiksi prosenttiluvut
pyöristyksen jälkeen lukuun 100.
Taulukon otsikkotekstien muokkaus
Kaksoisklikkaamalla taulukon tekstiä päästään
kirjoittamaan teksti uudestaan. Siten esimerkiksi voidaan tarvittaessa
kääntää otsikkotekstit suomeksi:

Sarakkeiden leveyden muuttaminen ja sarakkeiden poistaminen
Sarakkeiden reunoista voi 'ottaa kiinni' ja vetää sitä kauemmas.
Vetämällä sarakkeen oikea reuna kiinni vasempaan voidaan
tarpeeton sarake poistaa kokonaan:
Taulukon suunnan vaihto
Hyvin leveiden taulukoiden siirto tekstidokumenttiin voi tuottaa vaikeuksia.
(Taulukon reuna voi mennä helposti sivun oikean reunan yli). Tällöin
voi olla kätevää kääntää taulukko toisin
päin valitsemalla Pivot valikosta Transpose Rows and Columns:
Taulukon ulkoasun vaihto
SPSS tulostaulukoilla on oletustyyppi. Tyypin voi vaihtaa valinnoilla
Format > TableLook. Avautuu lomake:
jossa vasemmalla puolella ovat valittavat ulkoasun tyypit. Esimerkiksi
viivoituksen lisääminen rivien väliin voi olla hyödyllistä.
Tämän saa aikaan valitsemalla jokin Boxed-tyypeistä:
4.2 Tulosten siirto tekstidokumenttiin
Tulostaulukon voi siirtää dokumenttiin joko
-
copy + paste -toiminnoilla tai
-
eksportoimalla sen formaattiin, jonka tekstinkäsittelyohjelma osaa
avata
Copy + Paste
Tällöin siis valitaan ensin siirrettävä taulukko (taulukot)
joko Output-ikkunan vasemman puolen 'sisällysluettelosta' tai suoraan
klikkaamalla siirrettävää taulukkoa ikkunan oikeanpuoleisesta
osasta. Tämän jälkeen valitaan Output-ikkunan Edit-valikosta
Copy ja vastaavasti tekstinkäsittelyohjelmassa (Word?) Paste-vaihtoehto.
Tällöin taulukko tulee (ainakin Wordissa) editoitavassa muodossa
dokumenttiin.
Taulukon exportointi
Taulukko (tai isompikin osa output-ikkunan sisältöä) muunnetaan
sopivaan formaattiin valitsemalla ensin siirrettävä tulostusosa
ja valitsemalla tämän jälkeen File-valikosta vaihtoehto
Export. Avautuu lomake:
File Name -kohtaan kirjoitetaan siis tiedoston nimi, johon taulukot
siirretään. File Type -valikosta valitaan sopiva tiedoston tyyppi.
Valittavana ovat tyypit:
-
html
-
text file (useita vaihtoehtoja)
-
excel
-
word/rtf -file
-
powerpoint
-
pdf
-
None (graphics only)
Viimeistä vaihtoehtoa voi käyttää silloin kun haluaa
siirtää kuvia johonkin määrättyyn kuvaformaattiin,
esimerkiksi jpeg-furmaattiin.
5. Muuttujamuunnokset
Tavallisesti datan alkuperäiset muuttujat eivät riitä. Tarvitaan
esimerkiksi summamuuttujaa s.o. muuttujaa, joka muodostuu alkuperäisten
muuttujien summasta. Tällaiset muuttujamuunnokset saadaan aikaan
TRANSFORM-valikosta. Vaihtoehdot ovat seuraavat:
Vaihtoehtoja on siis hyvinkin monta. Tärkeimpiä ovat:
Funktionaalinen muunnos
Luokitellun muuttujan luokkien muutos
Jatkuvan muuttujan luokittelu
Tekstimuuttuja numeraaliseksi
Muuttujamuunnoksia voi tehdä myös (kuten kaikki muutkin toiminnot)
syntaksilla kirjoittamalla vastaava komento syntax-ikkunaan ja suorittamalla
se.
5.1 Compute-muunnos
Compute-vaihtoehtoa voi käyttää silloin, kun on olemassa
lauseke eli funktio, joka määrää uuden muuttujan arvot.
Compute-lomake avautuu valinnoilla TRANSFORM > COMPUTE:
Kohtaan Target Variable kirjoitetaan uuden muuttujan nimi,
kohtaan Numeric Expression-laatikkoon lauseke, joka määrää
uuden muuttujan arvon. Muita kohtia ei välttämättä
tarvitse täyttää. Hyvä tapa on kuitenkin klikata vielä
Type&Label-painiketta
ja ruksata siitä kohta: Use expression as label. Tällöin
uuden muuttujan nimen selitykseksi tulee kaava, jolla se on muodostettu.
Kaikki käytettävissä olevat funktiot löytyvät
Functions-laatikon sisältä. Lomakkeen Help-painikkeen kautta
löytää funktioiden tarkemman kuvauksen.
Summa- ja keskiarvomuuttujat
Summa-muuttuja voidaan muodostaa Compute-muunnoksen avulla. Tässä
voidaan käyttää joko + -merkkiä muuttujien välillä
tai SUM-funktiota. Muuttujien SALBEGIN ja SALARY summa voidaan siis muodostaa
kirjoittamalla Numeric Expression-laatikkoon joko:
tai
Tulos ei kuitenkaan välttämättä ole sama: SUM-funktiota
käytettäessä puuttuva tieto korvataan nollalla ja summan
arvo on siis valideista (ei-puuttuvista) muuttujien arvoista laskettu summa.
Käytettäessä + -merkkiä summalausekkeen arvo on puuttuva
aina silloin kuin yhdenkin summeerattavan muuttujan arvo on puuttuva.
Esimerkiksi, jos SALBEGIN = 15000 ja SALARY = . (puuttuva), niin
-
SALBEGIN + SALARY = . (puuttuva)
-
SUM(SALBEGIN,SALARY) = 15000
Vastaavasti keskiarvomuuttuja voidaan muodostaa joko MEAN-funktion
avulla tai kirjoittamalla keskiarvon kaava. Samaten kuin summamuuttujan
tapauksessa nämä eri vaihtoehdot tuottavat erilaisen tuloksen:
MEAN-funktion kautta muodostettu keskiarvo lasketaan validien (ei-puuttuvien)
arvojen keskiarvona. Laskettaessa keskiarvo kaavalla
-
S = (S1 + S2 + S3 + … + Sn )/ n
on tulos puuttuva tieto, jos yksikin muuttujien S1, S2, … Sn arvoista puuttuu.
SUM.n
Summafunktiota voidaan käyttää muodossa:
Tässä kirjain n (= 1,2,3,...) määrää kuinka
monen muuttujan arvo tulee olla validi eli ei-puuttuva, jotta summamuuttujan
arvo olisi ei-puuttuva. Siis esim. muunnoksen:
arvo on ei-puuttuva vain, jos kaikkien muuttujien A1, A2 ja A3 arvo on
ei-puuttuva.
Vastaavalla tavalla keskiarvomuunnoksissa voi käyttää
MEAN.n-funktiota.
0-1-muuttujat
Kirjoittamalla Compute-lomakkeessa Numeric Expression-laatikkoon pelkkä
ehtolause, siis esimerkiksi vaikkapa:
saadaan aikaan muuttuja, joka saa arvon 1, kun kyseinen ehto on voimassa
ja arvon 0 muulloin.
Aika-funktioiden käyttö
Versioissa 13 lähtien
Versiosta 13 lähtien SPSS-ohjelmaan on kuulunut datedif funktio. Sen
avulla voidaan kahden päivämäärän välinen
aika laskea halutussa yksikössä:
Jos muuttujaan PAIVAM1 on tallettunut ensimmäinen päivämäärä
ja PAIVAM2 toinen, niin niiden välinen aika saadaan tallettumaan muuttujaan
näin:
-
VUOSIA = DATEDIF(PAIVAM2,PAIVAM1,"years")
-
KUUKAUSIA = DATEDIF(PAIVAM2,PAIVAM1,"months")
-
PAIVIA = DATEDIF(PAIVAM2,PAIVAM1,"days")
Eli tuossa VUOSIA -muuttujaan arvoksi tulee aika vuosina, KUUKAUSI -muuttujaan
kuukausina ja PAIVIA -muuttujaan päivien lukumäärä.
On huomattava, että aika tallettuu kokonaislukuna pyöristettynä
alaspäin. Jos siis haluaa vaikkapa laskea henkilön iän tarkan
arvon vuosissa, on syytä laskea tutkimuspäivämäärän
ja syntymäajan välinen ero päivissä ja jakaa tämä
sitten päivien lukumäärällä vuodessa:
-
IKA = DATEDIF(TUTKIMUSPAIVA,SYNTYMAAIKA,"days") / 365.24
Versioissa 10, 11 tai 12
Jos datedif-funktio ei ole käytettävissä (ts. versiossa
12 tai aiemmissa versioissa) voidaan päivämäärien välinen
aika laskea kaavalla
-
VUOSIA1 = (TUTKPAIV-SYNTPAIV)/(365.25*24*3600).
Tässä muuttuja TUTKPAIV ilmaisee tutkimuspäivämäärän
ja SYNTPAIV henkilön syntymäpäivämäärän.
Muuttujien TUTKPAIV sekä SYNTPAIV tulee olla päivämäärätyyppisiä
ts. Date-tyyppiä. [SPSS tallettaa päivämäärän
sekunteina laskien päivämäärästä 14.10.1582.
Täten kaavassa esiintyvä muuttujien erotus ilmaisee ajanjakson
pituuden sekunneissa. Tästä kaavassa esiintyvä nimittäjän
lauseke.] Mikäli tutkimuspäivä on kaikilla havainnoilla
sama, on yksinkertaisinta käyttää funtiota DATE.DMY, jolla
voidaan ilmaista tutkimuspäivämäärä muodossa:
-
TUTKPAIV = DATE.DMY(paiva,kuukausi,vuosi).
5.2 Recode-muunnos
Recode-muunnoksella tehdään muuttujan uudelleen
luokitus. Esimerkiksi jatkuvasta muuttujasta saadaan uusi luokiteltu
muuttuja. Samaten Recode-muunnosta voidaan käyttää
luokkien yhdistämiseen.
Valitsemalla TRANSFORM > RECODE saadaan näkyviin kaksi vaihtoehtoa:
Into
Same Variable tai Into Different Variable. On syytä valita
jälkimmäinen vaihtoehto:
Vasemmanpuoleisesta muuttujaluettelosta siirrettään Input
Variable -> Output Variable-laatikkoon se muuttuja, jonka arvoja halutaan
uudelleen luokittella.
Tämän jälkeen kirjoitetaan Output Variable-laatikkoon
uuden, syntyvän muuttujan nimi ja klikataan Change-painiketta.
Klikkaamalla tämän jälkeen Old and New Values-painikketta,
avautuu lomake:
Tässä annetaan ensin vasemmalla puolella vanhan muuttujan
arvo. Tämä voi olla yksittäinen arvo tai myös kokonainen
väli. Ja tämän jälkeen annetaan tätä vastaava
uuden muuttujan arvo. Ja sen jälkeen klikataan Add-painiketta.
Näin jatketaan, kunnes kaikille vanhan muuttujan arvoille on annettu
vastaavat uuden muuttujan arvot. Lopuksi klikataan Continue- ja
päälomakkeen Ok-painiketta.
5.3 Automatic Recode
Automatic Recode-muunnosta tarvitaan tekstimuuttujan muuttamisessa numeeriseksi.
Useat SPSS-analyysit eivät osaa käsitellä tekstimuuttujia,
jolloin voidaan k.o. muunnoksella tehdä tekstimuuttujaa vastaava numeerinen
muuttuja. Muunnos siirtää automaattisesti alkuperäisen tekstimuuttujan
arvot uuden muuttujan arvojen selityksiksi, joten tulostuksessa näkyvät
alkuperäiset tekstit. Valinta TRANSFORM > Automatic Recode avaa lomakkeen:
Numeeriseksi muunnettava muuttuja siirretään laatikkoon Variable
-> New Name. Uudelle (numeeriselle muuttujalle) annetaan nimi New
Name-laatikkoon ja klikataan New Name-painiketta.
5.4 Yleinen ehdollinen muunnos
Recode-muunnos hyväksyy vain yhden muuttujan, jonka arvot määräävät
uuden muuttujan arvon. Mikäli haluaa tehdä luokituksen, joka
riippuu useammasta kuin yhdestä vanhasta muuttujasta, voi kirjoittaa
-
peräkkäisiä IF-käskyjä (Syntax-ikkunassa)
tai
-
käyttää Compute-muunnosta
Seuraavassa muodostetaan muuttuja GM, joka
= 1, kun GENDER = 'f' ja MINORITY = 1
= 2, kun GENDER = 'f' ja MINORITY = 0
= 3, kun GENDER = 'm' ja MINORITY = 1
= 4, kun GENDER = 'm' ja MINORITY = 0
Peräkkäisillä IF-käskyillä
Kirjoitetaan Syntax-ikkunaan seuraavat käskyt:
IF (GENDER = 'f' AND MINORITY = 1) GM = 1.
IF (GENDER = 'f' AND MINORITY = 0) GM = 2.
IF (GENDER = 'm' AND MINORITY = 1) GM = 3.
IF (GENDER = 'm' AND MINORITY = 0) GM = 4.
EXECUTE.
ja suoritetaan ne.
Compute-muunnoksella
Kirjoitetaan Numeric expression -laatikkoon seuraava kaava:
(GENDER = 'f' AND MINORITY = 1)*1 +
(GENDER = 'f' AND MINORITY = 0)*2 +
(GENDER = 'm' AND MINORITY = 1)*3 +
(GENDER = 'm' AND MINORITY = 0)*4
(Kaavassa kukin sulkulauseke saa arvon 1, jos kyseinen ehto on voimassa
ja 0, jos se ei ole voimassa. Siten esimerkiksi havainnoille, joille gender
= 'm' ja minority = 1, toteutuu kolmas ehto ja muut eivät. Siis näille
havainnoille kaava antaa arvoksi 0*1 + 0*2 + 1*3 + 0*4 = 3.)
5.5 Visual Binning
12-versiosta alkaen ohjelmassa on käytettävissä mahdollisuus
tehdä uusia muuttujia graafisesti. Muunnos löytyy valinnoilla:
Transform > Visual Binning. Valinta avaa lomakkeen:
Seuraavassa teemme uuden muuttujan SALCLASS luokittelemalla palkkamuuttujan
SALARY useampaan luokkaan:
Viemme siis k.o. muuttujan Variables to Bin -laatikkoon. Klikkaamalla
tämän jälkeen Continue-painiketta avautuu lomake:
Uuden luokitellun muuttujan nimi kirjoitetaan Binned Variable
-laatikkoon. Luokkien rajat saadaan tämän jälkeen määrättyä
mukavimmin klikkaamalla Make Cutpoints -painiketta:
Avautuu lomake, josta voidaan tasaväliset luokat ruksaamalla Equal
Width Intervals. Tällöin riittää syöttää
ensimmäisen luokan yläraja ja välien leveys:
Tämän jälkeen Apply-painikkeen klikkaus, saa aikaan seuraavan
näkymän:
Jakovälien rajat ovat siis näkyvissä. Jakovälejä
voi nyt muuttaa vetämällä rajaviivaa. Lopuksi kannattaa
antaa luokille arvoselitykset ts. value labelit. Tämä käy
kätevimmin klikkaamalla Make Labels -painiketta:
Lopuksi OK -painikkeella saamme aikaan uuden muuttujan SALCLASS.
Muuttujan SALCLASS jakaumassa tulostuvat nyt mukavasti myös luokkien
rajat:
Harjoitustehtäviä
1. Muodosta 0-1-muuttuja, joka saa arvon 1, jos palkka (= SALARY)
on pienempi kuin (3/2)*alkupalkka (= SALBEGIN). Onko tällaisia henkilöitä?
2. Employee data -aineiston tiedot ovat (suurin piirtein) 1.1.1979.
Laske uusi muuttuja IKA ts. henkilön ikä (1.1.1979).
3. Muodosta uusi muuttuja, joka
= 1, kun SALARY < 20000
= 2, kun 20000 < SALARY <= 40000
= 3, kun SALARY > 40000
Lisää muuttujaan sopivat arvoselitykset.
4. Muodosta 3-luokkainen palkkaluokitus, jossa kuhunkin luokkaan sisältyy
suurin piirtein sama määrä (n. 33 %) havainnoista.
(Ohje: valitse Transform > Categorize Variables)
6. Datan käsittely
6. 1 Havaintojen valinta
Valitsemme DATA > SELECT CASES...
Ruksaamme kohdan If condition is satisfied. Tämän jälkeen
klikkaamme If-painiketta. Avautuu lomake:
Tässä tyhjänä olevaan laatikkoon kirjoitetaan se
ehto, jonka valittavien havaintojen tulee täyttää. Tämän
jälkeen klikataan Continue-painiketta ja lopuksi OK-painikkeella
suoritetaan valinta. T'ällöin ne havainnot, jotka eivät
toteuta valintaehtoa ‘pyyhitään yli'. Tästä eteenpäin
kaikki analyysit kohdistuvat vain valittuun osaan havaintoja. Filteroidut
havainnot voidaan palauttaa valitsemalla uudestaan Data > Select Cases,
ja tämän jälkeen kohta All cases.
Havaintojen valinnalla voidaan luoda myös kokonaan uusi aineisto
valitsemalla Select Cases -lomakkeen Output-kohdasta:
oletuksen, s.o. Filter out unselected cases sijasta Copy
selected cases to a new dataset -vaihtoehto.
6. 2 Analyysit kaikille
osa-aineistoille
Helpoin tapa suorittaa jokin toimenpiden tai analyysi useille eri havaintoryhmille,
on jakaa ensin havaintotiedosto osiin eli tehdä datan splittaus.
Tässä vaihtoehdossa meillä tulee olla valmiina se luokitteleva
muuttuja, joka jakaa havaintojoukon osiin. Valitsemme DATA > SPLIT FILE:
Tästä pääsemme lomakkeseen, josta valitsemme vaihtoehdon
Repeated
....
Ja siirrämme ryhmitykseen käytettävän luokittelevan
muuttujan oikeanpuoleiseen laatikkoon. Lopuksi painamme Ok-painiketta,
jolloin tiedosto splitataan tämän valitun luokittelevan muuttujan
suhteen. Tämän jälkeiset analyysipyynnöt suoritetaan
automaattisesti kaikissa osaryhmissä erikseen. Datan splittaus perutaan
samalla tavalla kuin Select Cases-operaatio ts. valitaan uudestaan Data
> Split File ja tämän jälkeen avautuvasta lomakkeesta ruksataan
All-vaihtoehto.
HUOM: Split File-operaatio vaihtaa havaintojen järjestystä
ja havaintojen järjestys ei palaudu, vaikka palauttaa kaikki havainnot
takaisin yhteen ryhmään. (Järjestys palautuu avaamalla havaintotiedosto
uudestaan (jos mahdollista) tai sorttaamalla havainnot havaintotunnuksen
mukaan, jos tällainen muuttuja on olemassa ja sen alkuperäinen
järjestys on nouseva.)
6.3 Havaintojen
järjestäminen. Sorttaus.
Sorttaus tehdään valinnoilla DATA > SORT CASES.... Tämä
avaa lomakkeen, jossa valitaan avainmuuttuja(t), jonka määräämään
järjestykseen havainnot järjestyvät.
6.4 Aggregointi
Valinta DATA > AGGREGATE yhdistää kaikki johonkin ryhmään
kuuluvat havainnot uudeksi havaintoyksiköksi, jonka havaintoarvo on
ryhmään kuuluvien arvojen keskiarvo. Lopputuloksena on tällöin
uusi havaintotiedosto, jossa havaintojen lukumäärä on sama
kuin alkuperäisen havaintotiedoston ryhmien lukumäärä.
Ryhmämuuttuja annetaan avautuvassa lomakkeessa sijoittamalla k.o.
muuttuja Break-laatikkoon:
Aggregoinnin vaihtoehdot ovat:
-
Add aggregated variables to active dataset jolloin
uudet aggregoidut muuttujat tulevat uusiksi muuttujiksi työtiedostoon
-
Create a new dataset
syntyy uusi data-ikkuna, johon tallettuvat vain aggregoidut muuttujat sekä
break-muuttuja(t)
-
Write a new data file ...
syntyy uusi data, johon tallettuvat vain aggregoidut muuttujat sekä
break-muuttuja(t) ja data tallettuu
suoraan pysyväksi havaintotiedostoksi (*.sav -tiedostoksi)
Seuraavassa lisäämme Employee data -havaintoaineistoon muuttujan
SALARY keskiarvot EDUC-muuttujan ryhmissä:
Havaintotiedostoon ilmestyy uusi muuttuja SALARY_MEAN, jonka arvot ovat
muuttujan SALARY keskiarvo kussakin EDUC-muuttujan ryhmässä:
6.5 Havaintotiedostojen
yhdistäminen
Kaksi havaintotiedostoa voidaan yhdistää siten, että työtiedosto
ts. se tiedosto, joka näkyy aktiivisena Data editor-ikkunassa täydennetään
jollain havaintoaineistolla. Valinta Data > Merge files johtaa vaihtoehtoihin
Add cases tai Add variables. Jos kahden havaintotiedoston muuttujat ovat
samat ja haluamme yhdistää havainnot, tulee valita ensimmäinen
vaihtoehto. Toinen vaihtoehto soveltuu tapauksiin, jossa tiedostoilla on
samat havainnot, mutta eri muuttujat.
Muuttujien lisääminen toisesta tiedostosta tapahtuu joko
havaintojen mukaisessa järjestyksessä tai ns. avainmuuttujien
avulla. Jälkimmäinen tapa on ehdottomasti suositeltavampi.
Tulee huomata, että tällöin
-
aineistot tulee ensin järjestää kyseisen avainmuuttujan
suhteen
-
avainmuuttuja tulee olla määritelty täsmälleen samalla
tavalla kussakin aineistossa eli jos se esimerkiksi on tekstityyppinen
muuttuja, niin kummassakin aineistossa sen pituus tulee olla sama.
6.6 Muuttujan tai
havainnon poistaminen
Muuttuja poistetaan klikkaamalla ensin muuttujan nimeä ts. harmaata
yläriveä Data editor-ikkunassa ja tämän jälkeen
painamalla Delete-näppäintä. Vastaavalla poistetaan havainto
klikkaamalla k.o. rivin numeroa rivin vasemmassa laidassa ja sen jälkeen
Delete-näppäintä.
6.7 Muuttujan
lisääminen tai siirtäminen toiseen paikkaan
Muuttuja voidaan lisätä johonkin sarakkeeseen Edit-valikon Insert
Variable -valinnalla. Muuttujan sijainti voidaan vaihtaa klikkaamalla muuttujan
nimeä ja vetämällä se sitten haluttuun paikkaan Data-ikkunassa.
Harjoitustehtäviä
Seuraavissa tehtävissä käytetään edelleen Employee
data -aineistoa:
1. Poimi havaintotiedostosta ne henkilöt, joiden palkka SALARY
on vähintään 2 kertaa niin suuri kuin heidän alkupalkkansa
SALBEG.
2. Kuinka monta miestä ja vastaavasti naista kuuluu tähän
ryhmään?
3. Tulosta palkan keskiarvo kaikissa eri koulutustasoilla
ts. muuttujan SALARY keskiarvo muuttujan EDUC määräämissä
ryhmissä käyttäen SPLIT FILE-operaatiota.
4. Tee tehtävä 4 käyttäen valintoja Analyze > Compare
means > means… (Dependent = SALARY, Independent = EDUC)
5. Muodosta Empoyee-aineistosta uusi havaintotiedosto aggregoimalla.
Käytä ryhmämuuttujana muuttujaa EDUC ja aggregointitavaksi
valitse keskiarvo, aggregoitaviksi muuttujiksi valitse muuttujat SALARY
sekä SALBEGIN.. Talleta tiedosto hakemistoon R:\ nimellä
AGGR.SAV
7. Keskiarvotestit
Keskiarvotestit eli SPSS:n varianssianalyysi-vaihtoehdot löytyvät
Analyze-valikosta valinnoilla
-
Compare Means
-
General Linear Model
-
Mixed Models
Jos selittäviä muuttujia on vain yksi, kannattaa valita Compare
Means. Jos niitä on enemmän, on pakko valita General Linear Model-vaihtoehto.
Mixed Models -vaihtoehdon alta löytyy SPSS:n sekamallien analyysi.
Compare Means-otsikko sisältää seuraavat vaihtoehdot:
-
Means procedure
-
One-Sample T Test procedure
-
Independent-Samples T Test procedure
-
Paired-Samples T Test procedure
-
One-Way ANOVA procedure
Means procedure otsikon salta saadaan tulostettua ryhmittäisiä
keskiarvoja. Se ei sisällä tilastollisia testejä. Tavallinen
riippumattomien otosten t-testi saadaan valitsemalla Independent-Samples
T Test procedure. Yksisuuntainen varianssianalyysi saadaan tehtyä
valitsemalla viimeinen vaihtoehto.
7. 1 T-testi
Valitaan Analyze > Compare Means > Independent-Samples T Test procedure.
Avautuu lomake:
Muuttujaa, jonka keskiarvoja halutaan vertailla valitaan Test Variable-laatikkoon
ja selittävä s.o. luokitteleva muuttuja, joka jakaa havainnot
kahteen ryhmään, valitaan Grouping Variable-laatikkoon.
Tämän jälkeen Define Groups-painikkeen kautta tulee
antaa luokittelevan muuttujan arvot:
Lopuksi klikataan Continue- ja OK-painiketta.
Tulokset tulevat kahteen taulukkoon. Toiseen tulostuvat tunnusluvut:
Toiseen tulostuu itse t-testin tulos:
T-testi-taulukko käsittää kaksi vaihtoehtoa:
-
Equal variances assumed
-
Equal variances not assumed
Taulukko sisältää Levene-testin, jonka perusteella
valitaan toinen ylläolevista t-testin varianteista. Ylläolevassa
taulukossa Levene-testin p-arvo on 0.284, joten voimme ajatella, että
varianssit ovat yhtäsuuret. Täten t-testin lopputulos voidaan
lukea Equal variances assumed riviltä: t = -2.704, df = 949, p = 0.007.
7.2 Yksisuuntainen varianssianalyysi
Analyysi toteutetaan valinnoilla Statistics > Compare Means > One-Way ANOVA.
Valinta avaa lomakkee:
Muuttuja, jonka keskiarvoja verrataan, valitaan Dependent List-laatikkoon
ja luokitteleva muuttuja s.o. selittävä muuttuja valitaan Factor-laatikkoon.
Post
Hoc-painikkeen kautta voidaan valita parittainen vertailutesti ja Options-painikkeen
kautta saadaan tulostettua esim. ryhmäkeskiarvoja ja muita tunnuslukuja.
Samaten k.o. painikkeen kautta saadaan aikaan testi testimuuttujan hajonnan
samuudelle eli homogeenisyystesti.
Seuraavassa valitsimme Scheffe-testit parittaisiksi vertailutesteiksi:
Anova-taulu:
Näemme, että ainakin jokin keskiarvoista eroaa muista, joten
muuttujalla JOBCAT on vaikutusta muuttujaan SALARY.
Parittaiset vertailut:
Muuttuja JOBCAT jakaa havainnot kolmeen ryhmään: Clerical,
Custodial, Manager. Näistä Clerical-ryhmä näyttäisi
eroavan Manager-ryhmästä. Ja Manager-ryhmä eroaa sekä
Clerical että Custodial-ryhmästä.
Testi varianssien yhtäsuuruudelle:
Testi osoittaa, etteivät ryhmittäiset varianssit
ole yhtäsuuria, joten keskiarvotestin oletukset eivät oikeastaan
ole voimassa!
8. Lineaarinen regressioanalyysi
Lineaarinen regressio edellyttää, että selitettävä
muuttuja Y riippuu lineaarisesti selittävistä muuttujista X1,X2,...Xp.
Voimme kirjoittaa mallin muodossa:
-
Y = B0 + B1*X1 + B2*X2 + ... + Bp*Xp + E
missä luvut B0, B1, ..., ap ovat regressiokertoimet ja muuttuja E
mallin residuaali. Muuttujaa
-
PRED_Y = B0 + B1*X1 + B2*X2 + ... + Bp*Xp
sanotaan mallin ennusteeksi.
Jos selittäviä muuttujia on vain yksi, voidaan malli kirjoittaa
muotoon:
Malli palautuu siis regressiosuoran piirtämiseen. Kerroin B0 on regressioyhtälön
vakiotermi (intercept) ja B1 kulmakerroin (slope).
Regressioyhtälön kertoimet B0, B1 estimoidaan pienimmän
neliösumman menetelmällä. Tässä lasketaan kunkin
pisteen etäisyys suorasta ja korotetaan se toiseen potenssiiin ja
näin saadut residuaalin neliöt summeerataan. Lopuksi etsitään
sellaiset kertoimien B0, B1 arvot, että k.o. summa on mahdollisimman
pieni.
Lineaarinen regressio saadaan aikaan valitsemalla Analyze > Regression
> Linear. Tästä päästään lomakkeeseen
Dependent-laatikkoon valitaan selitettävä muuttuja
ja Independent(s)-laatikkoon selittävä(t) muuttuja(t).
Save-painikkeen
kautta saadaan ennuste- sekä residuuaali-muuttujat talletettua uusiksi
muuttujiksi ja Plots-painikkeen kautta saadaan tulostettua erillaisia
hajontakuvioita mallin hyvyyden tarkastelua varten.
Selitysaste
Mallin selitysaste tallettuu Model Summary-laatikkoon. Esimerkissämme
se on (= R Square) 0.785.
Regressioyhtälö
B-sarakkeesta luemme estimoidun regressioyhtälön:
SALARY ~ -12120.8 + 1.914*SALBEGIN + 172.297*JOBTIME
Beta-sarakkeesta saamme kertoimien suhteellisen selitysarvon, Sig.-sarakkeesta
testin sille, että k.o. kerroin olisi 0. Esimerkkitapauksessamme kummankin
selittävän muuttujan regressiokerroin on nollasta eroava testin
mukaan.
9. Faktorianalyysi
Faktorianalyysilla voidaan löytää suuresta muuttujajoukosta
ulottuvuudet eli faktorit, joihin niihin liittyvät muuttujat keskittyvät.
Seuraavassa käytämme harjoitusaineistona ohjelmiston tarjoamaa
datatiedostoa judges.sav. Havaintoaineisto koostuu (hypoteettisesta) taitoluisteluesityksistä
annetuista pisteistä. Kukin muuttuja edustaa yhtä tuomaria ja
rivi yhtä esitystä.
Faktorianalyysi saadaan aikaan valitsemalla Analyze > Data Reduction
> Factor Analysis.
Variables-laatikkoon valitaan analyysiin mukaan otettavat muuttujat.
(Tässä valitsemme kaikki muuttujat analyysiin.)
Faktorointimenetelmät, faktorien lukumäärä
Menetelmä valitaan Extraction-painikkeen alta avautuvasta lomakkeen
Method-kohdasta:
Oletusmenetelmä on Principal components, joka ei oikeastaan
ole varsinainen faktorointimenetelmä. Muut tavallisimmat vaihtoehdot
ovat: Principal axis factoring eli pääakselifaktorointi
sekä Maximum likelihood eli suurimman uskottavuuden menetelmä.
Faktorien lukumäärä määräytyy oletusarvoisesti
itse ohjelmasta, s.o. analyysi muodostaa ne faktorit, joiden ominaisarvo
on suurempi kuin yksi. Faktorien lukumäärän voi määrätä
myös itse ruksaamalla y.o. lomakkeen Fixed number of factors
-kohdan ja kirjoittamalla k.o. laatikkoon halutun faktorien määrän.
Rotatointi
Oletusarvoisesti ohjelma ei suorita ratkaisun rotatointia. Rotatointi saadaan
aikaan Rotation-painikkeen alta. Valittavana on useita menetelmiä,
joista varimax on yleisimmin käytetty.
Faktorien talletus
Faktorit saadaan talletettua uusiksi muuttujiksi Scores-painikkeen
kautta.
Esimerkki
Rotatoitu faktorimatriisi
Tässä kahden faktorin ratkaisun rotatoitu faktorimatriisi:
Havaitsemme, että kaikki varsinaiset tuomarit latautuvat samalle
faktorille. Viimeinen muuttuja, joka esittää 'Enthusiast'ian
pisteitä eroaa muista ja latautuu ainoana toiselle faktorille. Lataukset
ovat kyseisen muuttujan ja faktorin korrelaatiokertoimia.
10. Grafiikka
Kuvia voi tehdä SPSS:llä ainakin seuraavilla tavoilla:
-
analyysi-lomakkeen kautta (jos lomakkeessa on kuvanpiirto mahdollisuus)
-
suoraan tulostaulukosta
-
Graph Builder-valinnan kautta
-
Mallikuvien valinnan kautta (Graph > Graphboard Template Chooser)
-
Graphs-valikon Legacy Dialogs -valinnan kautta
Viimeinen vaihtoehto jakaantuu vielä ns. standardi- ja interaktiiven
grafiikan osaan. [Näiden vaihtoehtojen lisäksi on käytettävissä
tietysti myös syntaksi, jolla voidaan tuottaa suoraan kuva].
10.1 Taulukosta kuva
Taulukosta tai sen osasta voidaan tehdä kuva. Seuraavassa tulostamme
ryhmitäisiä keskiarvoja valinnalla Analyze > Means. Avautuu lomake:
Saamme aikaan seuraavaan tulostaulukon:
Maalaamme taulukosta halutun osan:
Ja valitsemme Edit-valikosta Create Graph > Bar. Tulos näytti tältä:
10.2 Chart Builder
Graph-valikon Chart Builder -valinnalla voidaan rakentaa kuva osista. Graph
> Chart Builder avautuu lomake:
Eli Chart Builder -vaihtoehdon käyttö edellyttää
sitä, että
-
kategoristen muuttujien arvoille tulee asettaa arvoselitykset
-
muuttujien mitta-asteikko tulee määrittää oikein ts.
kategorisille muuttujille tasoksi nominal ja välimatka-asteikollisille
scale
Kun nämä ehdot täyttyvät ja klikkaa OK, niin päästään
Graph Builder -lomakkeeseen:
Yksinkertaisinta on valita alla olevista kuvatyyppi-vaihtoehdoista sopivin.
Seuraavassa valitsimme vaihtoehdon Histogram ja siitä edelleen avautuvista
kuvatyypeistä vedimme väestöpyramidia esittävän
kuvan. Päälomake näytti tältä:
Vedämme Split-laatikkoon GENDER-muuttujan ja Distribution-laatikkoon
SALARY-muuttujan. Lopputulos oli seuraava:
10.3 Graphboard Template Chooser
Mallikuva-vaihtoehdon avulla kuvan piirtäminen tapahtuu pitkälti
samalla tavalla kuin Excelissä. Seuraavasssa lyhyt esimerkki:
1. Valitaan siis Graphs > Graphboard Template Chooser
2. Avautuu lomake:
Tästä valitaan ensin muuttuja(t), jo(i)sta halutaan tehdä
kuva. Valitsemme seuraavassa salary, salbegin. Ohjelma tarjoaa nyt seuraavat
vaihtoehdot:
Valitsemme vaihtoehdon Binned Scatterplot (ja klikkaamme OK-painiketta).
Tulos oli seuraava:
Kuvaa vastaava syntaksi oli seuraava:
GGRAPH
/GRAPHDATASET NAME="graphdataset"
VARIABLES=salbegin[LEVEL=ratio] salary[LEVEL=ratio]
MISSING=LISTWISE REPORTMISSING=NO
/GRAPHSPEC SOURCE=VIZTEMPLATE(NAME="Binned Scatterplot"[LOCATION=LOCAL]
MAPPING( "y"="salbegin"[DATASET="graphdataset"]
"x"="salary"[DATASET="graphdataset"]))
LABEL="Binned Scatterplot: salbegin-salary"
DEFAULTTEMPLATE=NO.
Sekä mallikuva- että graph builder -vaihtoehdot rakentuvat
GGRAPH-komennon päälle, joka on osa GPL-kieltä (GPL
- graphic programming language).
GPL-manuaali löytyy SPSS:n manuaalisarjasta.
10.3. Grafiikka-valikon vaihtoehdot
17-versiossa grafiikka-valikon Legacy Dialogs -valinta jakautuu
kahteen osaaan
-
standardigrafiikkaan
-
interaktiiviseen grafiikkaan
Standardigrafiikka sisältää seuraavat vaihtoehdot:
Interaktiivisen grafiikan puolelta löytyvät pitkälti
samat vaihtoehdot:
Esitämme seuraavassa hajontakuvion (scatterplot) piirtämisen
vertailun vuoksi sekä standardi- että interaktiivisella grafiikalla.
10.4 Scatterplot
Standardigrafiikka
Valitsemme siis Graphs > Legacy Dialogs > Scatter/Dot. Valinta avaa lomakkeen,
josta on valittavissa seuraavat vaihtoehdot:
-
Simple Scatter
- tavallinen vaihtoehto (xvar,yvar, mahd. classvar)
-
Overlay Scatter
- useita y-x-pareja samaan kuvaan.
-
Matrix Scatter
- kaikki muuttujat kaikkien kanssa (samaan kuvaan)
-
3-D Scattere
- kolmiulotteiset pisteistöt (sisältää mahdollisuuden
kuvan pyöritykseen)
-
Simple Dot
- yhden jatkuvan muuttujan jakauma korkeintaan kahden kategorisen muuttujan
määräämissä luokissa
Simple Scatter -valinta avaa lomakkeen:
Valitsemme muuttujan SALBEGIN X-Axis -laatikkoon ja muuttujan
SALARY Y-Axis -laatikkoon. Tämän lisäksi haluamme
vielä erotella eri sukupuolten havainnot valitsemalla GENDER Set
Markers by -laatikkoon. Vielä viemme muuttujan ID Label Cases
by -kohtaan.
Tulos näytti tältä:
Standardigrafiikan puolella ei itse lomakkeella saa kuvaan lisättyä
esimerkiksi regressiosuoraa, vaan tämä tulee tehdä grafiikkaeditorilla,
grafiikkaeditorin käytöstä seuraavassa luvussa.
Interaktiivinen grafiikka
Tarkastellaan nyt saman kuvan tekemistä interaktiivisen grafiikan
valinnoilla: Graphs > Legacy Dialogs > Interactive > Scatterplot. Avautuu
lomake:
Interaktiivisen grafiikan lomakkeen käyttötapa eroaa muista
SPSS:n lomakkeista. Tässä tulee vetää muuttujat laatikoihin.
Vedämme siis muuttujan SALBEGIN X-akselin suuntaiselle laatikolle
ja vastaavasti muuttujan SALARY Y-akselin suuntaiselle laatikolle. Color-muuttujaksi
valitsemme muuttujan GENDER. Tulos näytti tältä:
Interaktiivisessa grafiikassa voidaan (päinvastoin kuin standardigrafiikassa)
lisätä kuvaan jo lomakkeella (esimerkiksi) regressiosuora. Regressiosuoran
saa lisättyä Fit-painikkeen kautta:
Valitsemme Method-valikosta vaihtoehdon Regression. Fit lines for -kohdasta
voimme valita joko Total tai Subgroups. Ruksaamalla kohdan Subgroups saamme
tulostettua eri regressiosuorat sekä naisille että miehille:
Regressiosuorien yhtälöjä ei 17-versio kirjoita automaattisesti
(15-versiossa tämä piirre vielä oli). Mallin selitysaste
tulostuu kyllä.
10.5 Kuvaeditori
Kuvat tulostuvat tulostaulukoiden tapaan Output-ikkunaan. Kaksoisklikkaamalla
kuvaa käynnistyy kuvaeditori, jolla pääsemme muokkaamaan
kuvaa. Aikaisemmissa versioissa standardigrafiikalla ja interaktiiviselle
grafiikalla oli eri kuvaeditorit. Versiossa 17 (ehkäpä jo versiossa
16) kuvaeditori on ihan sama. Tämä on hyvä asia sikäli,
ettei tarvitse opetella käyttämään kahta erilaista
muokkausvälinettä.
Kuvaeditori käynnistyy siis kaksoisklikkaamalla kuvaa:
Kuvaelementtien valinta
Kuvien editointi perustuu siihen, että ensin valitaan kuvaelementti,
jota halutaan muuttaa. Valinta noudattaa seuraavia sääntöjä:
-
Jos yksikään kuvaelementti ei ole valittu, yhden kuvaelementin
valinta valitsee kaikki (k.o. ryhmän) kuvaelementit.
-
Uudelleen suoritettu kuvaelementtien valinta valitsee vain kyseisen kuvaelementin
-
Esc-näppäimellä peruutetaan kaikki valinnat
Ensimmäinen klikkaus jostain pisteestä valitsee kaikki pisteet:
Toinen valinta valitsee vain kyseisen sukupuolen pisteet:
Esc-näppäimellä tyhjennetään valinnat:
Kuvaelementtien muokkaus
Kuvaelementtien muokkaus tapahtuu Properties-lomakkeen kautta. Ensin valitaan
kuvaelementti, jota halutaan muokata ja tämän jälkeen Properties-lomakkeen
kautta päästään muuttamaan kuvaelementin ominaisuuksia.
Properties-lomake avautuu (yleensä) samalla kun kuvaelementit on
valittu. Se voidaan myös avata hiiren oikealla painikkeella avautuvasta
valikosta tai myös Edit-valikon kautta.
Kuvapisteiden muokkaus
Klikataan kuvapistettä, jolloin kaikki pisteet tulevat siis
ensin valittua. Klikataan vielä miesten havaintopistettä, jolloin
tulee siis valittua vain miestä esittävät havaintopisteet.
Properties-lomakkeesta päästään nyt vaihtamaan
miesten havaintopisteiden symboli:
Seuraavassa valitsimme symboliksi nelilön ja suurensimme samalla
symbolin kokoa. Lopuksi Apply-painikkeella saamme valintamme aktivoitua.
Vastaavasti voimme tämän jälkeen kaksoisklikata Female-symbolia
kuvan oikean yläreunasta (Legend-osassa), jolloin vastaavasti voimme
asettaa naisten pisteiden symbolin ja symbolin koon. Jälleen Apply-painikkeella
saamme valintamme aktivoitua ja tämän jälkeen Close-painike
sulkee Marker-valinnan.
Pisteistö murtoviivaesityksenä
Oletusarvoisesti kuva tulostuu erillisinä pisteinä. Esitystapaa
voidaan vaihtaa kuvaeditorissa
Elements -valikon kautta valitsemalla Fit Line -vaihtoehto.
Regressiosuora
Regressiosuorat (tai -käyrät) saa aikaan valitsemalla ensin
pisteet, johon suora tulisi sovittaa. (Voi siis valita kaikki pisteet tai
jonkin ryhmän. Yllä valitsimme erikseen miesten ja naisten havaintopisteet).
Havaintotunnukset pisteisiin
Havaintotunnukset saa liitettyä pisteisiin valitsemalla ensin Data
Id Mode -ikonia:
kuvaeditorin
työkaluvalikoima-ikoneista ja klikkaamalla sen jälkeen haluttua
pistettä.
Otsikko kuvaan
Kuvan otsikko on syytä valita jo lomaketta täytettäessä
Titles-painikkeen kautta avautuvasta jatkolomakkeesta:
Akselistojen asetukset
Akselistoa pääsee muokkaamaan kaksoisklikkaamalla akselistoa,
jolloin avautuu (jos ei avoinna) Properties-lomake, josta edelleen tulee
valita Scale-painike. Avautuu lomake:
Tästä voi edelleen valita esim. logaritmisen asteikon (kuten
yllä) ja lopuksi Apply-painikkeella vahvistaa valinnan.
Fonttien asettaminen
Kuvien tekstien fonttia voidaan muuttaa kaksoisklikkaamalla muokattavaa
tekstiosaa. Voidaan vaihtaa tekstifontin tyyppiä, kokoa ja väriä.
10.6 Pylväskuviot
(Bar-vaihtoehto)
Valittavana pylvästyypit:
-
Simple - erilliset pylväät
-
Clustered - samaan alaryhmään kuuluvat pylväät
vierekkäin
-
Stacked - samaan alaryhmään kuuluvat pylväät
päällekkäin
Tämän lisäksi voidaan valita:
-
Summaries for groups of cases - pylvään korkeus määrittää
havaintojetunnusluvun k.o. luokassa
-
Summaries of separate var. - pylvään korkeus kuvaa muuttujan
tunnuslukua
-
Values of individual cases - pylvään korkeus esittää
muuttujan arvoa
Ensimmäinen vaihtoehto on oletus sekä selvästi yleisimmin
käypä vaihtoehto.
Histogram...-vaihtoehto eroaa näistä Bar-kuvista sikäli,
että se saa aikaan yhden jatkuvan
muuttujan jakaumakuvan, kun taas Bar tulostaa jatkuvan kuvan tunnuslukuja
toisen
luokkamuuttujan määräämissä luokissa.
10.7 Kuvatemplate
Jos käyttäjä on tehnyt kaksi samanlaista kuvaa, vaikkapa
kaksi kaksiulotteista pisteistöä. Voi hän soveltaa ensimmäisen
kuvan määrityksiä (akselisto, pisteiden esittämistapaa
yms.) toiseen kuvaan. Tämä tapahtuu siten, että ensimmäinen
kuva ensin talletetaan (.cht-tiedostoksi) Ja sitten toista kuvaa piirrettäessä
täytetään kuvanpiirtolomakkeesta tämä Template-kohta:
10.8 Kuvan talletus tai siirto
tekstinkäsittelyohjelmaan
Kuvan talletetaan tai tulostetaan tavalliseen Windows-ohjelman tapaan File-valikosta
löytyvillä SAVE AS tai vastaavasti PRINT-vaihtoehdoilla. Kuva
siirretään Windows-tekstinkäsittelyohjelmaan mukavimmin
leikepöydän kautta: kopioidaan se ensin leikepöydälle
valitsemalla Edit-valikosta Copy. Tämän jälkeen siirrytään
tekstinkäsittelyohjelmaan. Kopioidaan kuva haluttuun kohtaan valitsemalla
tekstinkäsittelyohjelman Edit-valikosta jokin seuraavista vaihtoehdoista:
-
Paste special (Liitä määräten)
Vaihtoehtoisesti kuvan eksportoida. Tällöin siirrettävä
kuva ensin valitaan. Tämän jälkeen valitaan File-valikosta
(tai hiiren oikean puolisesta painikkeesta avautusvasta valikosta) vaihtoehto
Export. Avautuu lomake:
Export File - laatikkoon kirjoitetetaan tiedoston nimi, johon
kuva talletetaan. File Type -valikosta valitaan sopiva kuvatiedoston tyyppi.
Hyvä valinta on esim. WMF (Windows Meta File). Jos kuvan kokoa
muutetaan, säilyttää WMF-tyyppi kuvan rakenteen.
11. Interaktiivisen grafiikan etuja
Interaktiivinen grafiikka löytyy siis valintojen Graphs > Legacy Dialogs
> Interactive kautta. Vaihtoehdot ovat:
-
Bar
-
Dot
-
Line
-
Ribbon
-
Drop-Line
-
Area
-
Pie
Interaktiivisen grafiikassa on joitain etuja standardi grafiikkaan nähden:
-
Samaan laatikkoon voi viedä useamman muuttujan
-
Syntaksi kattaa pitemmälle modifioidun kuvan kuin vastaava standardi
grafiikan syntaksi
11.1 Laatikkoon useampi muuttuja
Seuraavassa piirrämme kuvan, jossa on sekä SALBEGIN että
SALARY -muuttujien keskiarvot eroteltuna vielä sukupuolen mukaan.
Valitsemme Graphs > Interactive > Bar. Avautuu lomake, josta mustaamme
muuttujat SALBEGIN sekä SALARY:
(Huom: olemme vaihtaneet dataikkunassa SALARY sekä SALBEGIN -muuttujan
paikkaa, jotta saisimme piirrettäville pylväille järjestyksen
SALBEGIN, SALARY.) Viemme muuttujat y-akselille vetämällä
käden kuva y-akselin laatikkoon. Avautuu lomake:
Klikkaamme OK, jolloin palaamme takaisin Create Bar -lomakkeeseen:
Siirrämme vielä muuttujan GENDER Color-laatikkoon ja vaihdamme
laatikon tyypiksi Cluster. Tulos näytti tältä:
Lisäämme pylväiden päivin keskiarvon luottamusvälit
klikkaamalla lomakkeen yläosasta löytyvää Error
Bar -painiketta:

Saamme tulostumaan pylväiden päälle keskiarvon 95
prosentin luottamusväliä osoittavat väkäset:
Interaktiivisen grafiikan editori on hyvin joustava. Esimerkiksi tekstejä
voidaan vetää haluttuun paikkaan. Yksittäiset pylväät
voidaan värjätä halutulla värillä tai viivoituksella
jne.
11.2 Interaktiiviseen grafiikan syntaksi
Standardi grafiikka tarjoaa melko huonot mahdollisuudet tulostaa suuri
määrä kuvia samoin asetuksin. Esimerkiksi, jos käyttäjä
haluaa tulostaa 20 kuvaa samoilla akselimäärityksillä, on
tämä melko hankalaa. Käytettävissä on vain kuvatemplate.
Mutta kuvatemplate ei siirrä akselistomäärityksiä,
josta seuraa se, että kunkin tulostetun kuvan akselit joutuu standardigrafiikassa
editoimaan jälkikäteen. Interaktiivisessa grafiikassa asia hoituu
syntaksilla ts. käyttämällä komentokieltä. Seuraavassa
on esimerkkikuvaamme vastaava ajovirta:
IGRAPH /VIEWNAME='Bar Chart' /X1 = VAR(gender) TYPE = CATEGORICAL
/Y =
VAR(salary) TYPE = SCALE /COORDINATE = VERTICAL /X1LENGTH=3.0
/YLENGTH=3.0
/X2LENGTH=3.0 /CHARTLOOK='C:\Program Files\SPSS11\Looks\Classic.clo'
/CATORDER VAR(gender) (ASCENDING VALUES OMITEMPTY) /BAR(MEAN)
KEY=ON SHAPE =
RECTANGLE BASELINE = AUTO /ERRORBAR CI(95.0) DIRECTION
= BOTH CAPWIDTH (45)
CAPSTYLE = T.
EXE.
Komento näyttää aika kauhealta (muistaa), vaan senhän
voi generoida lomakkeen Paste-painikkeella. Voimme määrätä
y-akseliston rajat asettamalla kohtaan TYPE = SCALE lisämääre
(min = 0 max = 100000) ts. ajovirtamme näyttää tältä:
IGRAPH /VIEWNAME='Bar Chart' /X1 = VAR(gender) TYPE = CATEGORICAL
/Y =
VAR(salary) TYPE = SCALE(min=0 max=100000) /COORDINATE
= VERTICAL /X1LENGTH=3.0 /YLENGTH=3.0
/X2LENGTH=3.0 /CHARTLOOK='C:\Program Files\SPSS11\Looks\Classic.clo'
/CATORDER VAR(gender) (ASCENDING VALUES OMITEMPTY) /BAR(MEAN)
KEY=ON SHAPE =
RECTANGLE BASELINE = AUTO /ERRORBAR CI(95.0) DIRECTION
= BOTH CAPWIDTH (45)
CAPSTYLE = T.
EXE.
Tällöin y-akseli päättyy arvoon 100000:
12. SPSS-ohjelman asetukset
Komentojen lisääminen tulostuksiin:
Edit > Options... avaa lomakkeen:
Klikataan Viewer-kohtaa:
Ja ruksataan lomakkeen vasemmasta alareunasta löytyvä Display
commands in the log-kohta.
Ei sivutusta tulostuksiin
EDIT > OPTIONS .. Avautuvasta lomakkeesta klikataan Viewer-kohtaa
ja ruksataan Text Output Page Size / Length-laatikosta ruksataan
Infinite-kohta.