Antti Nevanlinna
28.2.2010

Spss for  Windows

 1. Johdanto

  1. Ohjelman versiot
  2. Suomenkieliset oppaat
  3. Suomenkielisiä WWW:stä löytyviä oppaita
  4. Ohjelman ikkunat
  5. Ohjelman käyttötavat

2. Aineisto havaintotiedostoksi

  1. Havaintotiedoston rakenne
  2. Havaintotiedoston muodostus
  3. Muuttujien määrittely ja aineiston syöttö
  4. Excel-taulun siirto SPSS-havaintotiedostoksi

3. Kuvailevat analyysit

  1. Muuttujien keskiarvot, keskihajonnat, minimit ja maksimit
  2. Diskreetin muuttujan jakauma
  3. Jatkuvan muuttujan jakauma
  4. Ristiintaulukot
  5. Korrelaatiokerroin

4. Tulostaulukot

  1. Tulostaulukoiden muokkaus

5. Muuttujamuunnokset

  1. Compute-muunnos
  2. Recode-muunnos
  3. Automatic Recode
  4. Yleinen ehdollinen muunnos
  5. Visual Binning

6. Datan käsittely

  1. Havaintojen valinta
  2. Analyysit kaikille osa-aineistoille
  3. Havaintojen järjestäminen. Sorttaus
  4. Aggregointi
  5. Havaintotiedostojen yhdistäminen
  6. Muuttujan tai havainnon poistaminen
  7. Muuttujan lisääminen tai siirtäminen toiseen paikkaan

7. Keskiarvotestit

  1. T-testi
  2. Yksisuuntainen varianssianalyysi

8. Lineaarinen regressioanalyysi

9. Faktorianalyysi

10. Grafiikka

  1. Kaksi- ja kolmiulotteiset pisteistöt (Scatter)
  2. Kuvaeditori
  3. Pylväskuviot
  4. Kuvatemplate

11. Interaktiivinen grafiikka

  1. Interaktiivisen grafiikan kuvaeditori
  2. Interaktiisen grafiikan syntaksi

12. SPSS-ohjelman asetukset

 


1. Johdanto

1.1 Ohjelman versiot ja hankinta


 Ohjelmasta on yliopiston atk-ympäristössä käytössä useampia versioita:


Ohjelman hankinta:

Helpointa (ja halvinta) on ladata ohjelma tietotekniikka-osaston ohjelmistojakelun sivulta ohjelmistojakelu.helsinki.fi. Lataaminen vaatii yliopiston käyttäjätunnuksen (ns. pääkäyttäjätunnus). Ohjelmistojakelun sivulta saa myös haettua tarvittavan aktivointikoodin sekä asennusohjeet.

1.2 Suomenkieliset oppaat

Hyviä oppaita esim. seuraavat:
 

1.3 WWW:stä löytyviä oppaita

WWW:stä löytyy hyviä SPSS-oppaita (suomenkielisinäkin). Esim. seuraavat:
- Helsingin yliopiston valtiotieteellisen SPSS-kursseilla käytettyjä oppaita. Tekijänä Maarit Valtari löytyvät osoitteesta:
http://www.valt.helsinki.fi/blogs/valtari/

- Menetelmäopetuksen valtakunnallinen tietovaranto, http://www.fsd.uta.fi/menetelmaopetus/intro.html
sisältää SPSS-oppimisympäristö -osan.

Englanninkielisiä web-oppaita löytää
- esimerkisi Lancasterin yliopiston sivulta:
http://www.cas.lancs.ac.uk/short_courses/intro_spss.html
http://www.cas.lancs.ac.uk/short_courses/intro_spss.html
         - erittäin hyvä sivusto (myös) SPSS-ohjelmistosta löytyy UCLA:n Statistical Computing -sivustosta:
        http://www.ats.ucla.edu/stat/
 

Kattava luettelo englanninkielisistä oppaista on koottu sivulle: http://pages.infinit.net/rlevesqu/spss.htm

Manuaalit

Ohjelman käsikirjat on julkaistu pdf-muodossa ja saatavissa (= vapaasti ladattavissa)  meidän ohjelmistojakelun sivulta, hakemistosta SPSS/PASW 18 iso-tiedona PASW18_DOCS.ISO. Käsikirjoja ei välttämättä tarvita, mutta esimerkiksi kuvien teossa niistä voi olla apua. Erityisen hyödyllisiä manuaaleja ovat SPSS Statistics 18.0 Brief Guide (kuvien muokkaus) sekä PASW Statistics Base 18 (tulostaulukoiden muokkaus).
 

1.4 Ohjelman ikkunat

SPSS Windows sisältää 3 eri tyyppistä ikkunaa.
  Kun ohjelman aloittaa, avautuu (ainakin) Data -ikkuna. Data-ikkunaan voidaan syöttää havaintoaineisto tai ikkunaan voidaan avata valmiiksi havaintotiedostoksi talletettu aineistotiedosto. 14-versiosta alkaen SPSS-ohjelma voi sisältää useita Data-ikkunoita.

Output-ikkunaan ilmeistyvät analyysien tulokset sekä kuvat. Syntax-ikkunaan kirjoitetaan  komennot, mikäli  käytetään komentopohjaista työskentelytapaa. Syntax-ikkunan käyttö ts. komentojen käyttö ei ole välttämätöntä. Output- sekä syntax-ikkunoita voi olla useampia.
 

1.5 Ohjelman käyttötavat

Valikkomuotoinen käyttötapa

Data-ikkunan yläpuolella ovat valikot, joista käyttäjä valitsee halutun toimenpiteen. Valintojen jälkeen avautuu lomake, joka  täytetään. Tämän jälkeen klikataan lomakkeen OK-painiketta.

Esimerkiksi ohjelmiston mukana tulevan harjoitusdatan Employee data.sav muuttujan GENDER prosenttijakauman saa tehtyä seuraavasti:

Avautuu Frequencies-niminen lomake.


 

Aineiston muuttujat esiintyvät lomakkeen vasemmanpuoleisessa laatikossa. Tästä valitaan hiirellä muuttuja GENDER.  Klikkaamalla nuolta  muuttuja siirtyy Variables-laatikkoon. Tämän jälkeen OK-painikkeesta saadaan analyysi suoritettua.

Tulos ilmestyy Output-ikkunaan:


 
 

Komentopohjainen käyttötapa


Ohjelmaa voi käyttää myös syntaksimuotoisesti. Komennot kirjoitetaan (tai avataan) syntax-ikkunaan. Esimerkiksi edellinen tehtävä voitaisiin tehdä myös seuraavasti:

FREQUENCIES
  VARIABLES=gender
  /ORDER=  ANALYSIS .

Lomakkeet + syntaksi

Lomake-käyttömuodon ja komentojen käytön voi yhdistää tekemällä lomakkeella komennon pohjan. Tämä tehdään siten, että ensin täytetään  normaaliin tapaan lomake, mutta OK-painikkeen sijasta klikataankin Paste-painiketta. Tämä siirtää generoidun komennon syntax-ikkunaan, josta se voidaan suorittaa.
 
 

2. Aineisto havaintotiedostoksi

2.1 Havaintotiedoston rakenne

SPSS-havaintotiedosto koostuu riveistä ja sarakkeista. Yksi rivi vastaa yhden tapauksen tietoja (esim. henkilön vastauksia) ja yksi sarake yhteen kysymykseen annettuja vastauksia. Ohjelmistoon sisältyvä esimerkkitiedosto Employee data.sav näyttää Data editor -ikkunassa tällaiselta:


 

Ensimmäinen  muuttuja ID ilmaisee henkilön numeron, GENDER sukupuolen, BDATE henkilön syntymäajan. Muuttujan nimi esiintyy siis sarakkeen otsikkona. Muuttujan tyyppi voi olla esimerkiksi:

2.2 Havaintotiedoston muodostaminen

SPSS osaa käsitellä vain aineistoja, jotka tavalla tai toisella on saatu Data editor-ikkunaan. Esimerkiksi Mikäli aineisto syötetään suoraan Data-ikkunaan, kannattaa se lopuksi tallettaa havaintotiedostoksi, jolloin jatkossa aineiston saa avattua Data-ikkunaan File-valikon Open-vaihtoehdon kautta.

SPSS osaa avata myös muita kuin SPSS-tiedostoja. Tällöinkin kannattaa kuitenkin tallettaa aineisto SPSS-muotoon.
 

2.3 Muuttujien määrittely ja aineiston syöttö


Muuttujan määritykseen sisältyvät esimerkiksi seuraavat ominaisuudet:

Versiosta 10 alkaen muuttujan määrittely annetaan Data-ikkunan alaosasta löytyvän Variable View -painikkeen  kautta. Klikkaamalla k.o. painiketta avautuu näkymä:


 

Muuttujat määritellään yksi kerrallaan siten, että ensimmäiselle riville kirjoitetaan ensimmäisen muuttujan tiedot, toiselle riville toisen jne. Muuttujat tallettuvat havaintotiedostoon annetussa järjestyksessä.
 

Nimi

Muuttujan nimi kirjoitetaan taulukon Name-sarakkeeseen. Nimi sai olla vain 8 merkkiä pitkä aina 11-versioon asti. 12-versiosta lähtien  muuttujan nimi voi olla jopa  64 merkkiä pitkä. Voi kuitenkin olla hyvä käyttää edelleen lyhyitä muuttujan nimiä, jotta havaintotiedoston siirto toiselle tilasto-ohjelmistolle kävisi päinsä. Samaten ja samasta syystä voi olla järkevää on välttää skandeja, ts. kirjaimia Ä,Ö,Å, vaikka SPSS hyväksyykin ne. Vaikka SPSS-muuttujan nimi voi olla suurin piirtein millainen hyvänsä, nimi ei kuitenkaan saa alkaa numerolla eikä se saa sisältää välilyöntiä.

Tyyppi

Suositeltavat muuttujan  tyypit ovat numeric,  string ja date.


Label

Label-sarakkeeseen tallennetaan muuttujan nimen selitys. Nimen selitystä ei ole pakko antaa. (Jos sen jättää tekemättä, niin ohjelma käyttää nimen selityksenä itse nimeä.) Hyvä tapa on ehkä kuitenkin antaa varsinaisille kysymys-muuttujille yksinkertaiset nimet, esim. k1,k2,k3 jne ja lisätä kysymyksen varsinainen sisältö muuttujan nimen selitykseksi. Nimen selitystä eivät rajoita muuttujan nimeen sisältyvät rajoitteet. Se voi siis sisältää aivan hyvin välilyöntejä ja päin vastoin kuin muuttujan nimi, on se myös case-sensitiivinen. 15-versiossa nimen selitys voi olla aina 255 merkkiä pitkä.
 

Values

Muuttujan nimen selityksen lisäksi muuttujien arvoille voidaan antaa selitykset. Kategorisille muuttujille, s.o. muuttujille, joiden arvo ilmaisee sen, mihin luokkaan havaintoarvo kuuluu, on syytä antaa arvoselitykset. Tavallinen ja hyvä tapa on tallettaa kategorinen muuttuja numeeroarvoin, ja lisätä sitten numeroarvoihin arvoselitykset. Arvoselitykset kirjoitetaan Values-sarakkeeseen kaksoisklikkaamalla ensin kyseistä solua. Tällöin avautuu lomake:


 

Arvoselitykset annetaan siten, että ensin kirjoitetaan numeroarvo Value-kohtaan ja tämän jälkeen kyseistä arvoa vastaava selitys Label-kohtaan.. Kun yhdelle arvolle on annettu tällä tavoin selitysteksti, klikataan Add-painiketta. Tällä tavalla annetaan kaikille arvoille arvoselitys. Lopuksi OK-painikkeen kautta arvoselitys tallentuu kyseisen muuttujan kohdalle.

Puuttuvan tiedon koodi

Tämä tulee täyttää vain, jos esim. koodilla 9 on merkitty puuttuvaa tietoa  - tällöin numero 9  tulee määritellä puuttuvan tiedon koodiksi. Mikäli datan syötössä solu jätetään tyhjäksi,  ymmärtää ohjelma sen joka tapauksessa puuttuvaksi.
määreet jää pysyväksi.

Mittaustaso (Measure)

Muuttujan mittaustaso annetaan Measure-sarakkeella. Vaihtoehdot ovat Scale, Ordinal ja Nominal. Tilastotieteen teorian (ja soveltamisenkin) kannalta muuttujan mittaustaso on erittäin tärkeä, vaan ohjelma ei juuri käytä tätä tietoa. Tällä tiedolla on merkitystä lähinnä vain ns. interaktiivisessa grafiikassa.
 

Muuttujamääritysten tarkistus

Muuttujamääritykset voi tulostaa valinnoilla: File > Display Data File Information  > Working File

[Working File tarkoittaa SPSS-terminilogiassa Data ikkunassa olevaa aineistoa.]
 
 

Tyhjän havaintotiedoston talletus

Jos määritykset ovat kunnossa, kannattaa Data-ikkuna tallettaa: FILE > SAVE AS. Avautuvaan lomakkeeseen kirjoitetaan talletettavan havaintotiedoston nimi (ja valitaan hakemisto, johon tiedosto tallettuu.)
 

Aineiston syöttäminen

Aineisto syötetään (tavallisesti) havainto eli rivi kerrallaan. Tabulaattori- tai nuoli-näppäin siirtävät kursoria yhden askeleen oikealle, kun taas enter-näppäin siirtää askeleen alaspäin. Yhden rivin voi syöttää kätevästi maalaamalla se ensin klikkaamalla rivinumeroa. Tämän jälkeen enter-näppäin siirtääkin askeleen oikealle, joten tällöin sitä voi käyttää.

Muutaman havainnon eli rivin syöttämisen jälkeen kannattaa Data-ikkuna tallettaa. Ohjelma ei nimittäin sisällä automaattista tallennusta, joten ohjelman kaatuessa tallettamaton data menetetään.
 

Syötettyjen havaintoarvojen tarkistaminen

2.4 Excel-tiedoston siirto SPSS-havaintotiedostoksi

1. Yksinkertaisinta on Kun taulu on saatu avattua Data editor-ikkunaan, kannattaa se tallettaa SPSS-tiedostoksi.

Jos tiedosto sisältää useita tauluja, osaa ohjelma kysyä avattavaa taulua (ts. vain yksi taulu voidaan avata kerrallaan).

2. Toinen vaihtoehto on valinta: File > Open Database > New Query

Tämä tie on kuitenkin monimutkaisempi kuin tapa 1.
 

Harjoitustehtäviä

Seuraavassa on kuva havaintotiedostosta, jossa on kolme havaintoa ja viisi muuttujaa:


 

Havaintotiedoston rakenne on seuraava:
 

            List of variables on the working file

Name                                                                   Position

ID        Employee Code                                                       1
          Measurement Level: Scale
          Column Width: 5  Alignment: Right
          Print Format: F4
          Write Format: F4

BDATE     Date of Birth                                                       2
          Measurement Level: Scale
          Column Width: 10  Alignment: Right
          Print Format: EDATE10
          Write Format: EDATE10

JOBCAT    Employment Category                                                 3
          Measurement Level: Ordinal
          Column Width: 8  Alignment: Right
          Print Format: F1
          Write Format: F1
          Missing Values: 0

          Value    Label

              1    Clerical
              2    Custodial
              3    Manager

SALARY    Current Salary                                                      4
          Measurement Level: Scale
          Column Width: 8  Alignment: Right
          Print Format: F7.2
          Write Format: F7.2
          Missing Values: .00

SEX       Gender                                                              5
          Measurement Level: Nominal
          Column Width: 8  Alignment: Right
          Print Format: F1
          Write Format: F1

          Value    Label

              1    Female
              2    Male
 

1. Määrittele muuttujat eli anna muuttujille nimi, tarvittaessa tyyppi,
     nimen selitys sekä tarvittaessa arvoselitys.

2. Talleta tyhjä aineisto tiedostoksi r:\pohja.sav

3. Tarkista muuttujamääritykset valinnalla Utilities > File Info

4. Syötä havaintotiedoston arvot ts. nuo kolme havaintoa

5. Talleta havaintoaineisto SPSS-havaintotiedostoksi r:\bank2.sav

6. Tarkista syötetyt arvot.

3. Kuvailevat analyysit

3. 1 Muuttujien keskiarvot, keskihajonnat, minimit ja maksimit

Valitsemalla Analyze > Descriptive Statistics > Descriptive aukeaa lomake:

Oletusarvoisesti muuttujista lasketaan:

Options-painikkeen kautta voidaan valita muitakin tunnuslukuja:

Samaten muutujien tulostusjärjestystä voi vaihtaa Options-painikkeen avulla. Seuraavassa on tulostettu muuttujien AGE ja TIME tunnusluvut:


 
 

3.2 Diskreetin muuttujan jakauma

Mikäli muuttuja saa vain muutaman eri arvon, voidaan sen frekvenssi eli prosenttijakauma tulostaa valinnoilla ANALYZE > DESCRIPTIVE STATISTICS > FREQUENCIES:

Avautuvasta lomakkeesta valitaan muuttujat, joista jakauma halutaan tulostaa. Charts-painikkeen kautta saadaan tulostettua muutujan histogrammi (tai pylväsdiagrammi).
 

3.3 Jatkuvan muuttujan jakauma

Jatkuvan muuttujan jakaumaa kannattaa tarkastella Explore-vaihtoehdon avulla valitsemalla Analyze > Descriptive Statistics > Explore. Avautuvasta lomakkeesta päästään tulostamaan sekä useita tunnuslukuja (mm. mediaani, moodi, kvartiileja) sekä erityyppisiä jakaumakuvia mm. boxplot-esitys sekä stem-leaf-kuva:

Dependent-laatikkoon valitaan tutkittava jatkuva muuttuja ja Factor List-laatikkoon voidaan valita luokkamuuttuja(t), jonka määräämissä luokissa halutaan tutkia testimuuttujan jakaumaa.
 

3.4 Ristiintaulukot

Kahden luokitteluasteikollisen (nominaalisen) muuttujan riippuvuutta voidaan tutkia muodostamalla ristiintaulukko. Toinen muuttujista valitaan rivimuuttujaksi ja toinen sarakemuuttujaksi.

Ristiintaulukko saadaan aikaan valinnoilla: Analyze > Descriptive Statistics > Crosstabs. Avautuu lomake:

Rivimuuttuja(t) sijoitetaan Row(s)-laatikkoon ja sarakemuuttujat Column(s)-laatikkoon. Kukin rivimuuttuja taulukoidaan jokaisen sarakemuuttujan kanssa, joten jos vaikkapa rivimuuttujia on 4 ja sarakemuuttujia 6, on tuloksena 4*6 = 24 taulukkoa.

Oletusarvoisesti kuhunkin ristiintaulukon soluun tulostuu pelkästään k.o. soluun kuuluvien havaintojen lukumäärä. Cells-painikkeen kautta päästään lomakkeeseen, josta voidaan valita esim. riviprosentit.

Statistics-painikkeen kautta, ruksaamalla Chi-quare-kohta, saadaan taulukkoon liitettyä khi-neliö-testi, joka testaa rivi- ja sarakemuuttujien riippumattomuuden.
 

3.5 Korrelaatiokerroin

Kahden jatkuvan s.o. intervalliasteikollisen muuttujan (lineaarisen) riippuvuuden astetta kuvaa korrelaatiokerroin. SPSS tulostaa korrelaatiokertoimen valinnoilla Analyze > Correlate > Bivariate:

Muuttujat, joiden väliltä halutaan laskea korrelaatiokerroin, valitaan Variables-laatikkoon. SPSS tulostaa kaikkien muuttujaparien välisen korrelaation eli koko korrelaatiomatriisin:


Kussakin solussa on ylimpänä itse korrelaatiokerroin. Tämän alla on testi nolla-hypoteesille: k.o. korrelaatiokerroin = 0. Alimpana on niiden havaintojen lukumäärä, josta k.o. korrelaatiokerroin on laskettu.
 
 

4. Tulostaulukot

Analyysien tulokset ilmestyvät Output-ikkunaan. Seuraavassa teemme havaintoaineiston Employee data.sav muuttujan MINORITY frekvenssijakauman valinnoilla: Analyze > Descriptive Statistics > Frequencies (ja valitsemalla sitten MINORITY-muuttujan tulostettavaksi muuttujaksi). Taulukko ilmestyy OUTPUT-ikkunaan:

Output-ikkuna jakaantuu kahteen osaan. Vasempaan tulostuu tulostusten sisällysluettelo ja itse tulostaulukot ilmestyvät output-ikkunan oikeanpuoleiseen osaan.

4.1 Tulostaulukoiden muokkaus

Tulostaulukkoa päästään muokkaamaan kaksoisklikkaamalla sitä. Muokkaustilassa taulukon ympärille piirtyy 'risuaita':
 

Samalla Output-ikkunan yläpuolelle ilmestyvät Pivot- sekä Format-valikot, joita käyttäen saamme tulostaulukkoa muokattua. Seuraavassa joitakin tavallisimpia operaatiota.
 

Desimaalien määrän vaihto

Mustataan se osa taulukkoa, jonka desimaalimäärään halutaan tehdä muutos:

Tämän jälkeen valitaan Format-valikosta Cell Properties ja edelleen Format Value -välilehti. Avautuu lomake:


 

josta voidaan sekä lisätä että vähentää desimaalien määrää. Seuraavassa asetimme desimaalien määrän 0:aan:
 


 

Huom: Ohjelma ei tarkista, summautuvatko esimerkiksi prosenttiluvut pyöristyksen jälkeen lukuun 100.
 

Taulukon otsikkotekstien muokkaus

Kaksoisklikkaamalla taulukon tekstiä päästään kirjoittamaan teksti uudestaan. Siten esimerkiksi voidaan tarvittaessa kääntää otsikkotekstit suomeksi:

 

Sarakkeiden leveyden muuttaminen ja sarakkeiden poistaminen

Sarakkeiden reunoista voi 'ottaa kiinni' ja vetää sitä kauemmas. Vetämällä sarakkeen oikea reuna kiinni vasempaan voidaan tarpeeton sarake poistaa kokonaan:


 

Taulukon suunnan vaihto

Hyvin leveiden taulukoiden siirto tekstidokumenttiin voi tuottaa vaikeuksia. (Taulukon reuna voi mennä helposti sivun oikean reunan yli). Tällöin voi olla kätevää kääntää taulukko toisin päin valitsemalla Pivot valikosta Transpose Rows and Columns:


 

Taulukon ulkoasun vaihto

SPSS tulostaulukoilla on oletustyyppi. Tyypin  voi vaihtaa valinnoilla Format > TableLook. Avautuu lomake:
 


 

jossa vasemmalla puolella ovat valittavat ulkoasun tyypit. Esimerkiksi viivoituksen lisääminen rivien väliin voi olla hyödyllistä. Tämän saa aikaan valitsemalla jokin Boxed-tyypeistä:


 
 

4.2 Tulosten siirto tekstidokumenttiin

Tulostaulukon voi siirtää dokumenttiin joko
 

Copy + Paste

Tällöin siis valitaan ensin siirrettävä taulukko (taulukot) joko Output-ikkunan vasemman puolen 'sisällysluettelosta' tai suoraan klikkaamalla siirrettävää taulukkoa ikkunan oikeanpuoleisesta osasta. Tämän jälkeen valitaan Output-ikkunan Edit-valikosta Copy ja vastaavasti tekstinkäsittelyohjelmassa (Word?) Paste-vaihtoehto. Tällöin taulukko tulee (ainakin Wordissa) editoitavassa muodossa  dokumenttiin.
 

Taulukon exportointi

Taulukko (tai isompikin osa output-ikkunan sisältöä) muunnetaan sopivaan formaattiin valitsemalla ensin siirrettävä tulostusosa ja valitsemalla  tämän jälkeen File-valikosta vaihtoehto Export. Avautuu lomake:

File Name -kohtaan kirjoitetaan siis  tiedoston nimi, johon taulukot siirretään. File Type -valikosta valitaan sopiva tiedoston tyyppi. Valittavana ovat tyypit:
 

Viimeistä vaihtoehtoa voi käyttää silloin kun haluaa siirtää kuvia johonkin määrättyyn kuvaformaattiin, esimerkiksi jpeg-furmaattiin.

5. Muuttujamuunnokset

Tavallisesti datan alkuperäiset muuttujat eivät riitä. Tarvitaan esimerkiksi summamuuttujaa s.o.  muuttujaa, joka muodostuu alkuperäisten muuttujien summasta. Tällaiset muuttujamuunnokset saadaan aikaan TRANSFORM-valikosta. Vaihtoehdot ovat seuraavat:

Vaihtoehtoja on siis hyvinkin monta. Tärkeimpiä ovat:

Funktionaalinen muunnos Luokitellun muuttujan luokkien muutos Jatkuvan muuttujan luokittelu Tekstimuuttuja numeraaliseksi
 

Muuttujamuunnoksia voi tehdä myös (kuten kaikki muutkin toiminnot) syntaksilla kirjoittamalla vastaava komento syntax-ikkunaan ja suorittamalla se.
 

5.1 Compute-muunnos

Compute-vaihtoehtoa voi käyttää silloin, kun on olemassa lauseke eli funktio, joka määrää uuden muuttujan arvot. Compute-lomake avautuu valinnoilla TRANSFORM > COMPUTE:

Kohtaan Target Variable kirjoitetaan uuden muuttujan nimi,  kohtaan Numeric Expression-laatikkoon lauseke, joka määrää uuden muuttujan arvon. Muita kohtia ei välttämättä tarvitse täyttää. Hyvä tapa on kuitenkin klikata vielä Type&Label-painiketta ja ruksata siitä kohta: Use expression as label. Tällöin uuden muuttujan nimen selitykseksi tulee kaava, jolla se on muodostettu.

Kaikki käytettävissä olevat funktiot löytyvät Functions-laatikon sisältä. Lomakkeen  Help-painikkeen kautta löytää funktioiden tarkemman kuvauksen.
 

Summa- ja keskiarvomuuttujat

Summa-muuttuja voidaan muodostaa Compute-muunnoksen avulla. Tässä voidaan käyttää joko + -merkkiä muuttujien välillä tai SUM-funktiota. Muuttujien SALBEGIN ja SALARY summa voidaan siis muodostaa kirjoittamalla Numeric Expression-laatikkoon joko: tai Tulos ei kuitenkaan välttämättä ole sama: SUM-funktiota käytettäessä puuttuva tieto korvataan nollalla ja summan arvo on siis valideista (ei-puuttuvista) muuttujien arvoista laskettu summa. Käytettäessä + -merkkiä summalausekkeen arvo on puuttuva aina silloin kuin yhdenkin summeerattavan muuttujan arvo on puuttuva.
Esimerkiksi, jos SALBEGIN = 15000 ja SALARY = . (puuttuva), niin


Vastaavasti keskiarvomuuttuja voidaan muodostaa joko MEAN-funktion avulla tai kirjoittamalla keskiarvon kaava. Samaten kuin summamuuttujan tapauksessa nämä eri vaihtoehdot tuottavat erilaisen tuloksen: MEAN-funktion kautta muodostettu keskiarvo lasketaan validien (ei-puuttuvien) arvojen keskiarvona. Laskettaessa keskiarvo kaavalla

on tulos puuttuva tieto, jos yksikin muuttujien S1, S2, … Sn arvoista puuttuu.
 
SUM.n
Summafunktiota voidaan käyttää muodossa: Tässä kirjain n (= 1,2,3,...) määrää kuinka monen muuttujan arvo tulee olla validi eli ei-puuttuva, jotta summamuuttujan arvo olisi ei-puuttuva. Siis esim. muunnoksen: arvo on ei-puuttuva vain, jos kaikkien muuttujien A1, A2 ja A3 arvo on ei-puuttuva.

Vastaavalla tavalla keskiarvomuunnoksissa voi käyttää MEAN.n-funktiota.

0-1-muuttujat

Kirjoittamalla Compute-lomakkeessa Numeric Expression-laatikkoon pelkkä ehtolause, siis esimerkiksi vaikkapa:
  saadaan aikaan muuttuja, joka saa arvon 1, kun kyseinen ehto on voimassa ja arvon 0 muulloin.
 

Aika-funktioiden käyttö

Versioissa 13 lähtien

Versiosta 13 lähtien SPSS-ohjelmaan on kuulunut datedif funktio. Sen avulla voidaan kahden päivämäärän välinen aika laskea halutussa yksikössä:
Jos muuttujaan PAIVAM1 on tallettunut ensimmäinen päivämäärä ja PAIVAM2 toinen, niin niiden välinen aika saadaan tallettumaan muuttujaan näin: Eli tuossa VUOSIA -muuttujaan arvoksi tulee aika vuosina, KUUKAUSI -muuttujaan kuukausina ja PAIVIA -muuttujaan päivien lukumäärä. On huomattava, että aika tallettuu kokonaislukuna pyöristettynä alaspäin. Jos siis haluaa vaikkapa laskea henkilön iän tarkan arvon vuosissa, on syytä laskea tutkimuspäivämäärän ja syntymäajan välinen ero päivissä ja jakaa tämä sitten päivien lukumäärällä vuodessa:
 
 

Versioissa 10, 11 tai 12

Jos datedif-funktio ei ole käytettävissä (ts. versiossa 12 tai aiemmissa versioissa) voidaan päivämäärien välinen aika laskea kaavalla Tässä muuttuja TUTKPAIV ilmaisee tutkimuspäivämäärän ja SYNTPAIV henkilön syntymäpäivämäärän. Muuttujien TUTKPAIV sekä SYNTPAIV tulee olla päivämäärätyyppisiä ts. Date-tyyppiä.  [SPSS tallettaa päivämäärän sekunteina laskien päivämäärästä 14.10.1582. Täten kaavassa esiintyvä muuttujien erotus ilmaisee ajanjakson pituuden sekunneissa. Tästä kaavassa esiintyvä nimittäjän lauseke.]  Mikäli tutkimuspäivä on kaikilla havainnoilla sama, on yksinkertaisinta käyttää funtiota DATE.DMY, jolla voidaan ilmaista tutkimuspäivämäärä muodossa:
 

5.2 Recode-muunnos


Recode-muunnoksella  tehdään muuttujan uudelleen luokitus. Esimerkiksi jatkuvasta  muuttujasta saadaan uusi luokiteltu muuttuja. Samaten Recode-muunnosta voidaan käyttää  luokkien yhdistämiseen.

Valitsemalla TRANSFORM > RECODE saadaan näkyviin kaksi vaihtoehtoa: Into Same Variable tai Into Different Variable. On syytä valita jälkimmäinen vaihtoehto:

Vasemmanpuoleisesta muuttujaluettelosta siirrettään Input Variable -> Output Variable-laatikkoon se muuttuja, jonka arvoja halutaan uudelleen luokittella.
Tämän jälkeen kirjoitetaan Output Variable-laatikkoon uuden, syntyvän muuttujan nimi ja klikataan Change-painiketta. Klikkaamalla tämän jälkeen Old and New Values-painikketta, avautuu lomake:

Tässä annetaan ensin vasemmalla puolella vanhan muuttujan arvo. Tämä voi olla yksittäinen arvo tai myös kokonainen väli. Ja tämän jälkeen annetaan tätä vastaava uuden muuttujan arvo. Ja sen jälkeen klikataan Add-painiketta. Näin jatketaan, kunnes kaikille vanhan muuttujan arvoille on annettu vastaavat uuden muuttujan arvot. Lopuksi klikataan Continue- ja päälomakkeen Ok-painiketta.
 

5.3 Automatic Recode

Automatic Recode-muunnosta tarvitaan tekstimuuttujan muuttamisessa numeeriseksi. Useat SPSS-analyysit eivät osaa käsitellä tekstimuuttujia, jolloin voidaan k.o. muunnoksella tehdä tekstimuuttujaa vastaava numeerinen muuttuja. Muunnos siirtää automaattisesti alkuperäisen tekstimuuttujan arvot uuden muuttujan arvojen selityksiksi, joten tulostuksessa näkyvät alkuperäiset tekstit. Valinta TRANSFORM > Automatic Recode avaa lomakkeen:


Numeeriseksi muunnettava muuttuja siirretään laatikkoon Variable -> New Name. Uudelle (numeeriselle muuttujalle) annetaan nimi New Name-laatikkoon ja klikataan New Name-painiketta.

5.4 Yleinen ehdollinen muunnos

Recode-muunnos hyväksyy vain yhden muuttujan, jonka arvot määräävät uuden muuttujan arvon. Mikäli haluaa tehdä luokituksen, joka riippuu useammasta kuin yhdestä vanhasta muuttujasta, voi kirjoittaa tai


Seuraavassa muodostetaan muuttuja GM, joka

 = 1, kun GENDER = 'f' ja MINORITY = 1
 = 2, kun GENDER = 'f' ja MINORITY = 0
 = 3, kun GENDER = 'm' ja MINORITY = 1
 = 4, kun GENDER = 'm' ja MINORITY = 0

Peräkkäisillä IF-käskyillä

Kirjoitetaan Syntax-ikkunaan seuraavat käskyt:

IF (GENDER = 'f' AND MINORITY = 1) GM = 1.
IF (GENDER = 'f' AND MINORITY = 0) GM = 2.
IF (GENDER = 'm' AND MINORITY = 1) GM = 3.
IF (GENDER = 'm' AND MINORITY = 0) GM = 4.
EXECUTE.

ja suoritetaan ne.

Compute-muunnoksella

Kirjoitetaan Numeric expression -laatikkoon seuraava kaava:

(GENDER = 'f' AND MINORITY = 1)*1 +
(GENDER = 'f' AND MINORITY = 0)*2 +
(GENDER = 'm' AND MINORITY = 1)*3 +
(GENDER = 'm' AND MINORITY = 0)*4

(Kaavassa kukin sulkulauseke saa arvon 1, jos kyseinen ehto on voimassa ja 0, jos se ei ole voimassa. Siten esimerkiksi havainnoille, joille gender = 'm' ja minority = 1, toteutuu kolmas ehto ja muut eivät. Siis näille havainnoille kaava antaa arvoksi 0*1 + 0*2 + 1*3 + 0*4 = 3.)
 
 

5.5 Visual Binning

12-versiosta alkaen ohjelmassa on käytettävissä mahdollisuus tehdä uusia muuttujia graafisesti. Muunnos löytyy valinnoilla: Transform > Visual Binning. Valinta avaa lomakkeen:


 
 
 

Seuraavassa teemme uuden muuttujan SALCLASS luokittelemalla palkkamuuttujan SALARY useampaan luokkaan:

Viemme siis k.o. muuttujan Variables to Bin -laatikkoon. Klikkaamalla tämän jälkeen Continue-painiketta avautuu lomake:

Uuden luokitellun muuttujan nimi kirjoitetaan Binned Variable -laatikkoon. Luokkien rajat saadaan tämän jälkeen määrättyä mukavimmin klikkaamalla Make Cutpoints  -painiketta:

Avautuu lomake, josta voidaan tasaväliset luokat ruksaamalla Equal Width Intervals. Tällöin riittää syöttää ensimmäisen luokan yläraja ja välien leveys:


 

Tämän jälkeen Apply-painikkeen klikkaus, saa aikaan seuraavan näkymän:


 

Jakovälien rajat ovat siis näkyvissä. Jakovälejä voi nyt muuttaa vetämällä rajaviivaa. Lopuksi kannattaa antaa luokille arvoselitykset ts. value labelit. Tämä käy kätevimmin klikkaamalla Make Labels -painiketta:


 

Lopuksi OK -painikkeella saamme aikaan uuden muuttujan SALCLASS.
 

Muuttujan SALCLASS jakaumassa tulostuvat nyt mukavasti myös luokkien rajat:


 
 

Harjoitustehtäviä


1. Muodosta 0-1-muuttuja, joka saa arvon 1, jos palkka (= SALARY) on pienempi kuin (3/2)*alkupalkka (= SALBEGIN). Onko tällaisia henkilöitä?

2. Employee data -aineiston tiedot ovat (suurin piirtein) 1.1.1979. Laske uusi muuttuja IKA ts. henkilön ikä (1.1.1979).

3. Muodosta uusi muuttuja, joka

= 1, kun SALARY < 20000
= 2, kun 20000 < SALARY <= 40000
= 3, kun SALARY > 40000
Lisää muuttujaan sopivat arvoselitykset.

4. Muodosta 3-luokkainen palkkaluokitus, jossa kuhunkin luokkaan sisältyy suurin piirtein sama määrä (n. 33 %) havainnoista.
(Ohje: valitse Transform > Categorize Variables)
 

6. Datan käsittely

6. 1 Havaintojen valinta

Valitsemme DATA > SELECT CASES...

Ruksaamme kohdan If condition is satisfied. Tämän jälkeen klikkaamme If-painiketta. Avautuu lomake:

Tässä tyhjänä olevaan laatikkoon kirjoitetaan se ehto, jonka valittavien havaintojen tulee täyttää. Tämän jälkeen klikataan Continue-painiketta ja lopuksi OK-painikkeella suoritetaan valinta. T'ällöin ne havainnot, jotka eivät toteuta valintaehtoa ‘pyyhitään yli'.  Tästä eteenpäin kaikki analyysit kohdistuvat vain valittuun osaan havaintoja. Filteroidut havainnot voidaan palauttaa valitsemalla uudestaan Data > Select Cases, ja tämän jälkeen kohta All cases.

Havaintojen valinnalla voidaan luoda myös kokonaan uusi aineisto valitsemalla Select Cases -lomakkeen Output-kohdasta:

oletuksen, s.o. Filter out unselected cases  sijasta Copy selected  cases to a new dataset -vaihtoehto.

6. 2 Analyysit kaikille osa-aineistoille

Helpoin tapa suorittaa jokin toimenpiden tai analyysi useille eri havaintoryhmille, on jakaa ensin havaintotiedosto osiin eli tehdä datan splittaus. Tässä vaihtoehdossa meillä tulee olla valmiina se luokitteleva muuttuja, joka jakaa havaintojoukon osiin. Valitsemme DATA > SPLIT FILE:

Tästä pääsemme lomakkeseen, josta valitsemme vaihtoehdon Repeated .... Ja siirrämme ryhmitykseen käytettävän luokittelevan muuttujan oikeanpuoleiseen laatikkoon. Lopuksi painamme Ok-painiketta, jolloin tiedosto splitataan tämän valitun luokittelevan muuttujan suhteen. Tämän jälkeiset analyysipyynnöt suoritetaan automaattisesti kaikissa osaryhmissä erikseen. Datan splittaus perutaan samalla tavalla kuin Select Cases-operaatio ts. valitaan uudestaan Data > Split File ja tämän jälkeen avautuvasta lomakkeesta ruksataan All-vaihtoehto.

HUOM: Split File-operaatio vaihtaa havaintojen järjestystä ja havaintojen järjestys ei palaudu, vaikka palauttaa kaikki havainnot takaisin yhteen ryhmään. (Järjestys palautuu avaamalla havaintotiedosto uudestaan (jos mahdollista) tai sorttaamalla havainnot havaintotunnuksen mukaan, jos tällainen muuttuja on olemassa ja sen alkuperäinen järjestys on nouseva.)
 

6.3 Havaintojen järjestäminen. Sorttaus.

Sorttaus tehdään valinnoilla DATA > SORT CASES.... Tämä avaa lomakkeen, jossa valitaan avainmuuttuja(t), jonka määräämään järjestykseen havainnot järjestyvät.
 

6.4 Aggregointi

Valinta DATA > AGGREGATE yhdistää kaikki johonkin ryhmään kuuluvat havainnot uudeksi havaintoyksiköksi, jonka havaintoarvo on ryhmään kuuluvien arvojen keskiarvo. Lopputuloksena on tällöin uusi havaintotiedosto, jossa havaintojen lukumäärä on sama kuin alkuperäisen havaintotiedoston ryhmien lukumäärä. Ryhmämuuttuja annetaan avautuvassa lomakkeessa sijoittamalla k.o. muuttuja Break-laatikkoon:

Aggregoinnin vaihtoehdot ovat:

Seuraavassa lisäämme Employee data -havaintoaineistoon muuttujan SALARY keskiarvot EDUC-muuttujan ryhmissä:

Havaintotiedostoon ilmestyy uusi muuttuja SALARY_MEAN, jonka arvot ovat muuttujan SALARY keskiarvo kussakin EDUC-muuttujan ryhmässä:


 
 

6.5 Havaintotiedostojen yhdistäminen

Kaksi havaintotiedostoa voidaan yhdistää siten, että työtiedosto ts. se tiedosto, joka näkyy aktiivisena Data editor-ikkunassa täydennetään jollain havaintoaineistolla.  Valinta Data > Merge files johtaa vaihtoehtoihin Add cases tai Add variables. Jos kahden havaintotiedoston muuttujat ovat samat ja haluamme yhdistää havainnot, tulee valita ensimmäinen vaihtoehto. Toinen vaihtoehto soveltuu tapauksiin, jossa tiedostoilla on samat havainnot, mutta eri muuttujat.
Muuttujien lisääminen toisesta tiedostosta tapahtuu joko havaintojen mukaisessa järjestyksessä tai ns. avainmuuttujien avulla. Jälkimmäinen tapa on ehdottomasti suositeltavampi.

Tulee huomata, että tällöin

6.6 Muuttujan tai havainnon poistaminen

Muuttuja poistetaan klikkaamalla ensin muuttujan nimeä ts. harmaata yläriveä Data editor-ikkunassa ja tämän jälkeen painamalla Delete-näppäintä. Vastaavalla poistetaan havainto klikkaamalla k.o. rivin numeroa rivin vasemmassa laidassa ja sen jälkeen Delete-näppäintä.
 

6.7 Muuttujan lisääminen tai siirtäminen toiseen paikkaan

Muuttuja voidaan lisätä johonkin sarakkeeseen Edit-valikon Insert Variable -valinnalla. Muuttujan sijainti voidaan vaihtaa klikkaamalla muuttujan nimeä ja vetämällä se sitten haluttuun paikkaan Data-ikkunassa.
 

Harjoitustehtäviä

Seuraavissa tehtävissä käytetään edelleen Employee data -aineistoa:

1. Poimi havaintotiedostosta ne henkilöt, joiden palkka SALARY on vähintään 2 kertaa niin suuri kuin heidän alkupalkkansa SALBEG.

2. Kuinka monta miestä ja vastaavasti naista kuuluu tähän ryhmään?

3.  Tulosta palkan  keskiarvo kaikissa eri koulutustasoilla ts. muuttujan SALARY keskiarvo muuttujan EDUC määräämissä ryhmissä käyttäen SPLIT FILE-operaatiota.

4. Tee tehtävä 4 käyttäen valintoja Analyze > Compare means > means… (Dependent = SALARY, Independent = EDUC)

5. Muodosta Empoyee-aineistosta uusi havaintotiedosto aggregoimalla. Käytä ryhmämuuttujana muuttujaa EDUC ja aggregointitavaksi valitse keskiarvo, aggregoitaviksi muuttujiksi valitse muuttujat SALARY sekä SALBEGIN..  Talleta tiedosto hakemistoon R:\ nimellä AGGR.SAV
 
 

7. Keskiarvotestit

Keskiarvotestit eli SPSS:n varianssianalyysi-vaihtoehdot löytyvät Analyze-valikosta valinnoilla Jos selittäviä muuttujia on vain yksi, kannattaa valita Compare Means. Jos niitä on enemmän, on pakko valita General Linear Model-vaihtoehto. Mixed Models -vaihtoehdon alta löytyy SPSS:n sekamallien analyysi.

Compare Means-otsikko sisältää seuraavat vaihtoehdot:

Means procedure otsikon salta saadaan tulostettua ryhmittäisiä keskiarvoja. Se ei sisällä tilastollisia testejä. Tavallinen riippumattomien otosten t-testi saadaan valitsemalla Independent-Samples T Test procedure. Yksisuuntainen varianssianalyysi saadaan tehtyä valitsemalla viimeinen vaihtoehto.

7. 1 T-testi

Valitaan Analyze > Compare Means > Independent-Samples T Test procedure. Avautuu lomake:

Muuttujaa, jonka keskiarvoja halutaan vertailla valitaan Test Variable-laatikkoon ja selittävä s.o. luokitteleva muuttuja, joka jakaa havainnot kahteen ryhmään, valitaan Grouping Variable-laatikkoon. Tämän jälkeen Define Groups-painikkeen kautta tulee antaa luokittelevan muuttujan arvot:

Lopuksi klikataan Continue- ja OK-painiketta.

Tulokset tulevat kahteen taulukkoon. Toiseen tulostuvat tunnusluvut:

Toiseen tulostuu itse t-testin tulos:

T-testi-taulukko käsittää kaksi vaihtoehtoa:

Taulukko sisältää Levene-testin, jonka perusteella valitaan toinen ylläolevista t-testin varianteista. Ylläolevassa taulukossa Levene-testin p-arvo on 0.284, joten voimme ajatella, että varianssit ovat yhtäsuuret. Täten t-testin lopputulos voidaan lukea Equal variances assumed riviltä: t = -2.704, df = 949, p = 0.007.
 

7.2 Yksisuuntainen varianssianalyysi

Analyysi toteutetaan valinnoilla Statistics > Compare Means > One-Way ANOVA. Valinta avaa lomakkee:

Muuttuja, jonka keskiarvoja verrataan, valitaan Dependent List-laatikkoon ja luokitteleva muuttuja s.o. selittävä muuttuja valitaan Factor-laatikkoon. Post Hoc-painikkeen kautta voidaan valita parittainen vertailutesti ja Options-painikkeen kautta saadaan tulostettua esim. ryhmäkeskiarvoja ja muita tunnuslukuja. Samaten k.o. painikkeen kautta saadaan aikaan testi testimuuttujan hajonnan samuudelle eli homogeenisyystesti.

Seuraavassa valitsimme Scheffe-testit parittaisiksi vertailutesteiksi:
 

Anova-taulu:

 

Näemme, että ainakin jokin keskiarvoista eroaa muista, joten muuttujalla JOBCAT on vaikutusta muuttujaan SALARY.
 

Parittaiset vertailut:

Muuttuja JOBCAT jakaa havainnot kolmeen ryhmään: Clerical, Custodial, Manager. Näistä Clerical-ryhmä näyttäisi eroavan Manager-ryhmästä. Ja Manager-ryhmä eroaa sekä Clerical että Custodial-ryhmästä.
 

Testi varianssien yhtäsuuruudelle:

Testi osoittaa, etteivät  ryhmittäiset varianssit ole yhtäsuuria, joten keskiarvotestin oletukset eivät oikeastaan ole voimassa!
 
 

8. Lineaarinen regressioanalyysi

Lineaarinen regressio edellyttää, että selitettävä muuttuja Y riippuu lineaarisesti selittävistä muuttujista X1,X2,...Xp.
Voimme kirjoittaa mallin muodossa: missä luvut B0, B1, ..., ap ovat regressiokertoimet ja muuttuja E mallin residuaali. Muuttujaa sanotaan mallin ennusteeksi.

Jos selittäviä muuttujia on vain yksi, voidaan malli kirjoittaa muotoon:

Malli palautuu siis regressiosuoran piirtämiseen. Kerroin B0 on regressioyhtälön vakiotermi (intercept) ja B1 kulmakerroin (slope).
Regressioyhtälön kertoimet B0, B1 estimoidaan pienimmän neliösumman menetelmällä. Tässä lasketaan kunkin pisteen etäisyys suorasta ja korotetaan se toiseen potenssiiin ja näin saadut residuaalin neliöt summeerataan. Lopuksi etsitään sellaiset kertoimien B0, B1 arvot, että k.o. summa on mahdollisimman pieni.

Lineaarinen regressio saadaan aikaan valitsemalla Analyze > Regression > Linear. Tästä päästään lomakkeeseen

Dependent-laatikkoon valitaan selitettävä muuttuja ja Independent(s)-laatikkoon selittävä(t) muuttuja(t). Save-painikkeen kautta saadaan ennuste- sekä residuuaali-muuttujat talletettua uusiksi muuttujiksi ja Plots-painikkeen kautta saadaan tulostettua erillaisia hajontakuvioita mallin hyvyyden tarkastelua varten.
 

Selitysaste

Mallin selitysaste tallettuu Model Summary-laatikkoon. Esimerkissämme se on (= R Square) 0.785.
 

Regressioyhtälö

B-sarakkeesta luemme estimoidun regressioyhtälön:

    SALARY ~ -12120.8 + 1.914*SALBEGIN + 172.297*JOBTIME

Beta-sarakkeesta saamme kertoimien suhteellisen selitysarvon, Sig.-sarakkeesta testin sille, että k.o. kerroin olisi 0. Esimerkkitapauksessamme kummankin selittävän muuttujan regressiokerroin on nollasta eroava testin mukaan.
 
 

9. Faktorianalyysi

Faktorianalyysilla voidaan löytää suuresta muuttujajoukosta ulottuvuudet eli faktorit, joihin niihin liittyvät muuttujat keskittyvät.  Seuraavassa käytämme harjoitusaineistona ohjelmiston tarjoamaa datatiedostoa judges.sav. Havaintoaineisto koostuu (hypoteettisesta) taitoluisteluesityksistä annetuista pisteistä. Kukin muuttuja edustaa yhtä tuomaria ja rivi yhtä esitystä.

Faktorianalyysi saadaan aikaan valitsemalla Analyze > Data Reduction > Factor Analysis.


 

Variables-laatikkoon valitaan analyysiin mukaan otettavat muuttujat. (Tässä valitsemme kaikki muuttujat analyysiin.)
 

Faktorointimenetelmät, faktorien lukumäärä

Menetelmä valitaan Extraction-painikkeen alta avautuvasta lomakkeen Method-kohdasta:

Oletusmenetelmä on Principal components, joka ei oikeastaan ole varsinainen faktorointimenetelmä. Muut tavallisimmat vaihtoehdot ovat: Principal axis factoring eli pääakselifaktorointi sekä Maximum likelihood eli suurimman uskottavuuden menetelmä.

Faktorien lukumäärä määräytyy oletusarvoisesti itse ohjelmasta, s.o. analyysi muodostaa ne faktorit, joiden ominaisarvo on suurempi kuin yksi. Faktorien lukumäärän voi määrätä myös itse ruksaamalla y.o. lomakkeen Fixed number of factors -kohdan ja kirjoittamalla k.o. laatikkoon halutun faktorien määrän.

Rotatointi

Oletusarvoisesti ohjelma ei suorita ratkaisun rotatointia. Rotatointi saadaan aikaan Rotation-painikkeen alta. Valittavana on useita menetelmiä, joista varimax on yleisimmin käytetty.
 

Faktorien talletus

Faktorit saadaan talletettua uusiksi muuttujiksi Scores-painikkeen kautta.
 
 

Esimerkki

Rotatoitu faktorimatriisi
Tässä kahden faktorin ratkaisun rotatoitu faktorimatriisi:

Havaitsemme, että kaikki varsinaiset tuomarit latautuvat samalle faktorille. Viimeinen muuttuja, joka esittää 'Enthusiast'ian pisteitä eroaa muista ja latautuu ainoana toiselle faktorille. Lataukset ovat kyseisen muuttujan ja faktorin korrelaatiokertoimia.
 

10. Grafiikka

Kuvia voi tehdä SPSS:llä ainakin seuraavilla tavoilla: Viimeinen vaihtoehto jakaantuu vielä ns. standardi- ja interaktiiven grafiikan osaan. [Näiden vaihtoehtojen lisäksi on käytettävissä tietysti myös syntaksi, jolla voidaan tuottaa suoraan kuva].

10.1 Taulukosta kuva

Taulukosta tai sen osasta voidaan tehdä kuva. Seuraavassa tulostamme ryhmitäisiä keskiarvoja valinnalla Analyze > Means. Avautuu lomake:

Saamme aikaan seuraavaan tulostaulukon:

Maalaamme taulukosta halutun osan:

Ja valitsemme Edit-valikosta Create Graph > Bar. Tulos näytti tältä:


 
 
 

10.2 Chart Builder

Graph-valikon Chart Builder -valinnalla voidaan rakentaa kuva osista. Graph > Chart Builder avautuu lomake:

Eli Chart Builder -vaihtoehdon käyttö edellyttää sitä, että
 

Kun nämä ehdot täyttyvät ja klikkaa OK, niin päästään Graph Builder -lomakkeeseen:


 

Yksinkertaisinta on valita alla olevista kuvatyyppi-vaihtoehdoista sopivin. Seuraavassa valitsimme vaihtoehdon Histogram ja siitä edelleen avautuvista kuvatyypeistä vedimme väestöpyramidia esittävän kuvan. Päälomake näytti tältä:

Vedämme Split-laatikkoon GENDER-muuttujan ja Distribution-laatikkoon SALARY-muuttujan. Lopputulos oli seuraava:


 
 

10.3 Graphboard Template Chooser

Mallikuva-vaihtoehdon avulla kuvan piirtäminen tapahtuu pitkälti samalla tavalla kuin Excelissä. Seuraavasssa lyhyt esimerkki:

1. Valitaan siis Graphs > Graphboard Template Chooser
2. Avautuu lomake:

Tästä valitaan ensin muuttuja(t), jo(i)sta halutaan tehdä kuva. Valitsemme seuraavassa salary, salbegin. Ohjelma tarjoaa nyt seuraavat vaihtoehdot:


 

Valitsemme vaihtoehdon Binned Scatterplot (ja klikkaamme OK-painiketta). Tulos oli seuraava:

Kuvaa vastaava syntaksi oli seuraava:

GGRAPH
  /GRAPHDATASET NAME="graphdataset"
    VARIABLES=salbegin[LEVEL=ratio] salary[LEVEL=ratio]
    MISSING=LISTWISE REPORTMISSING=NO
  /GRAPHSPEC SOURCE=VIZTEMPLATE(NAME="Binned Scatterplot"[LOCATION=LOCAL]
    MAPPING( "y"="salbegin"[DATASET="graphdataset"] "x"="salary"[DATASET="graphdataset"]))
    LABEL="Binned Scatterplot: salbegin-salary"
    DEFAULTTEMPLATE=NO.

Sekä mallikuva- että  graph builder -vaihtoehdot rakentuvat GGRAPH-komennon päälle, joka on osa GPL-kieltä  (GPL - graphic programming language).
GPL-manuaali löytyy SPSS:n manuaalisarjasta.

10.3. Grafiikka-valikon vaihtoehdot


17-versiossa grafiikka-valikon Legacy Dialogs  -valinta jakautuu kahteen osaaan
 

Standardigrafiikka sisältää seuraavat vaihtoehdot:


 

Interaktiivisen grafiikan puolelta löytyvät pitkälti samat vaihtoehdot:


 

Esitämme seuraavassa hajontakuvion (scatterplot) piirtämisen vertailun vuoksi sekä standardi- että interaktiivisella grafiikalla.
 

10.4 Scatterplot

Standardigrafiikka

Valitsemme siis Graphs > Legacy Dialogs > Scatter/Dot. Valinta avaa lomakkeen, josta on valittavissa seuraavat vaihtoehdot: Simple Scatter -valinta avaa lomakkeen:


 

Valitsemme muuttujan SALBEGIN X-Axis -laatikkoon ja muuttujan SALARY Y-Axis -laatikkoon. Tämän lisäksi haluamme vielä erotella eri sukupuolten havainnot valitsemalla GENDER Set Markers by -laatikkoon. Vielä viemme muuttujan ID Label Cases by -kohtaan.

Tulos näytti tältä:


 

Standardigrafiikan puolella ei itse lomakkeella saa kuvaan lisättyä esimerkiksi regressiosuoraa, vaan tämä tulee tehdä grafiikkaeditorilla,  grafiikkaeditorin käytöstä seuraavassa luvussa.
 

Interaktiivinen grafiikka

Tarkastellaan nyt saman kuvan tekemistä interaktiivisen grafiikan valinnoilla: Graphs > Legacy Dialogs > Interactive > Scatterplot. Avautuu lomake:

Interaktiivisen grafiikan lomakkeen käyttötapa eroaa muista SPSS:n lomakkeista. Tässä tulee vetää muuttujat laatikoihin. Vedämme siis muuttujan SALBEGIN X-akselin  suuntaiselle laatikolle ja vastaavasti muuttujan SALARY Y-akselin suuntaiselle laatikolle. Color-muuttujaksi valitsemme muuttujan GENDER. Tulos näytti tältä:

Interaktiivisessa grafiikassa voidaan (päinvastoin kuin standardigrafiikassa) lisätä kuvaan jo lomakkeella (esimerkiksi) regressiosuora. Regressiosuoran saa lisättyä Fit-painikkeen kautta:

Valitsemme Method-valikosta vaihtoehdon Regression. Fit lines for -kohdasta voimme valita joko Total tai Subgroups. Ruksaamalla kohdan Subgroups saamme tulostettua eri regressiosuorat sekä naisille että miehille:


 

Regressiosuorien yhtälöjä ei 17-versio kirjoita automaattisesti (15-versiossa tämä piirre vielä oli). Mallin selitysaste tulostuu kyllä.
 
 

10.5 Kuvaeditori

Kuvat tulostuvat tulostaulukoiden tapaan Output-ikkunaan. Kaksoisklikkaamalla kuvaa käynnistyy kuvaeditori, jolla pääsemme  muokkaamaan kuvaa. Aikaisemmissa versioissa standardigrafiikalla ja interaktiiviselle grafiikalla oli eri kuvaeditorit. Versiossa 17 (ehkäpä jo versiossa 16) kuvaeditori on ihan sama. Tämä on hyvä asia sikäli, ettei tarvitse opetella käyttämään kahta erilaista muokkausvälinettä.

Kuvaeditori käynnistyy siis kaksoisklikkaamalla  kuvaa:
 


 
 

Kuvaelementtien valinta

Kuvien editointi perustuu siihen, että ensin valitaan kuvaelementti, jota halutaan muuttaa. Valinta noudattaa seuraavia sääntöjä: Ensimmäinen klikkaus jostain pisteestä valitsee kaikki pisteet:


 

Toinen valinta valitsee vain kyseisen sukupuolen pisteet:


 

Esc-näppäimellä tyhjennetään valinnat:


 
 

Kuvaelementtien muokkaus

Kuvaelementtien muokkaus tapahtuu Properties-lomakkeen kautta. Ensin valitaan kuvaelementti, jota halutaan muokata ja tämän jälkeen Properties-lomakkeen kautta päästään muuttamaan kuvaelementin ominaisuuksia.

Properties-lomake avautuu (yleensä) samalla kun kuvaelementit on valittu. Se voidaan myös avata hiiren oikealla painikkeella avautuvasta valikosta tai myös Edit-valikon kautta.
 

 Kuvapisteiden muokkaus


Klikataan kuvapistettä, jolloin kaikki pisteet tulevat siis ensin valittua. Klikataan vielä miesten havaintopistettä, jolloin tulee siis valittua vain miestä esittävät havaintopisteet. Properties-lomakkeesta päästään nyt  vaihtamaan miesten havaintopisteiden symboli:


 

Seuraavassa valitsimme symboliksi nelilön ja suurensimme samalla symbolin kokoa. Lopuksi Apply-painikkeella saamme valintamme aktivoitua. Vastaavasti voimme tämän jälkeen kaksoisklikata Female-symbolia kuvan oikean yläreunasta (Legend-osassa), jolloin vastaavasti voimme asettaa naisten pisteiden symbolin ja symbolin koon. Jälleen Apply-painikkeella saamme valintamme aktivoitua ja tämän jälkeen Close-painike sulkee Marker-valinnan.
 

Pisteistö murtoviivaesityksenä

Oletusarvoisesti kuva tulostuu erillisinä pisteinä. Esitystapaa voidaan vaihtaa kuvaeditorissa
Elements -valikon kautta valitsemalla Fit Line -vaihtoehto.
 

Regressiosuora


 

Regressiosuorat (tai -käyrät) saa aikaan valitsemalla ensin pisteet, johon suora tulisi sovittaa. (Voi siis valita kaikki pisteet tai jonkin ryhmän. Yllä valitsimme erikseen miesten ja naisten havaintopisteet).

Havaintotunnukset pisteisiin

Havaintotunnukset saa liitettyä pisteisiin valitsemalla ensin Data Id Mode -ikonia:  kuvaeditorin työkaluvalikoima-ikoneista ja klikkaamalla sen jälkeen haluttua pistettä.


 
 

Otsikko kuvaan

Kuvan otsikko on syytä valita jo lomaketta täytettäessä Titles-painikkeen kautta avautuvasta jatkolomakkeesta:


 


 
 

Akselistojen asetukset

Akselistoa pääsee muokkaamaan kaksoisklikkaamalla akselistoa, jolloin avautuu (jos ei avoinna) Properties-lomake, josta edelleen tulee valita Scale-painike. Avautuu lomake:


 

Tästä voi edelleen valita esim. logaritmisen asteikon (kuten yllä) ja lopuksi Apply-painikkeella vahvistaa valinnan.


 

Fonttien asettaminen

Kuvien tekstien fonttia voidaan muuttaa kaksoisklikkaamalla muokattavaa tekstiosaa.  Voidaan vaihtaa tekstifontin tyyppiä, kokoa ja väriä.
 

10.6 Pylväskuviot (Bar-vaihtoehto)

Valittavana pylvästyypit: Tämän lisäksi voidaan valita: Ensimmäinen vaihtoehto on oletus sekä selvästi yleisimmin käypä vaihtoehto.
Histogram...-vaihtoehto eroaa näistä Bar-kuvista sikäli, että se saa aikaan yhden jatkuvan
muuttujan jakaumakuvan, kun taas Bar tulostaa jatkuvan kuvan tunnuslukuja toisen
luokkamuuttujan määräämissä luokissa.
 

10.7 Kuvatemplate

Jos käyttäjä on tehnyt kaksi samanlaista kuvaa, vaikkapa kaksi kaksiulotteista pisteistöä. Voi hän soveltaa ensimmäisen kuvan määrityksiä (akselisto, pisteiden esittämistapaa yms.) toiseen kuvaan. Tämä tapahtuu siten, että ensimmäinen kuva ensin talletetaan (.cht-tiedostoksi) Ja sitten toista kuvaa piirrettäessä täytetään kuvanpiirtolomakkeesta tämä Template-kohta:
 

10.8 Kuvan talletus tai siirto tekstinkäsittelyohjelmaan

Kuvan talletetaan tai tulostetaan tavalliseen Windows-ohjelman tapaan File-valikosta löytyvillä SAVE AS tai vastaavasti PRINT-vaihtoehdoilla. Kuva siirretään Windows-tekstinkäsittelyohjelmaan mukavimmin leikepöydän kautta: kopioidaan se ensin leikepöydälle valitsemalla Edit-valikosta Copy. Tämän jälkeen siirrytään tekstinkäsittelyohjelmaan. Kopioidaan kuva haluttuun kohtaan valitsemalla tekstinkäsittelyohjelman Edit-valikosta jokin seuraavista vaihtoehdoista: Vaihtoehtoisesti kuvan eksportoida. Tällöin siirrettävä kuva ensin valitaan. Tämän jälkeen valitaan File-valikosta (tai hiiren oikean puolisesta painikkeesta avautusvasta valikosta) vaihtoehto Export. Avautuu lomake:
 


Export File - laatikkoon kirjoitetetaan tiedoston nimi, johon kuva talletetaan. File Type -valikosta valitaan sopiva kuvatiedoston tyyppi. Hyvä  valinta on esim. WMF (Windows Meta File). Jos kuvan kokoa muutetaan, säilyttää WMF-tyyppi kuvan rakenteen.
 

11. Interaktiivisen grafiikan etuja

Interaktiivinen grafiikka löytyy siis valintojen Graphs > Legacy Dialogs > Interactive kautta. Vaihtoehdot ovat: Interaktiivisen grafiikassa on joitain etuja standardi grafiikkaan nähden:
  1. Samaan laatikkoon voi viedä useamman muuttujan
  2. Syntaksi kattaa pitemmälle modifioidun kuvan kuin vastaava standardi grafiikan syntaksi

11.1 Laatikkoon useampi muuttuja

Seuraavassa piirrämme kuvan, jossa on sekä SALBEGIN  että SALARY -muuttujien keskiarvot eroteltuna vielä sukupuolen mukaan.  Valitsemme Graphs > Interactive > Bar. Avautuu lomake, josta mustaamme muuttujat SALBEGIN sekä SALARY:


 

(Huom: olemme vaihtaneet dataikkunassa SALARY sekä SALBEGIN -muuttujan paikkaa, jotta saisimme piirrettäville pylväille järjestyksen SALBEGIN, SALARY.) Viemme muuttujat y-akselille vetämällä käden kuva y-akselin laatikkoon. Avautuu lomake:


 

Klikkaamme OK, jolloin palaamme takaisin Create Bar -lomakkeeseen:


 

Siirrämme vielä muuttujan GENDER Color-laatikkoon ja vaihdamme laatikon tyypiksi Cluster. Tulos näytti tältä:


 

Lisäämme pylväiden päivin keskiarvon luottamusvälit klikkaamalla lomakkeen yläosasta löytyvää Error Bar -painiketta:


Saamme tulostumaan pylväiden päälle keskiarvon 95 prosentin luottamusväliä osoittavat väkäset:


 
 
 
 
 
 

Interaktiivisen grafiikan editori on hyvin joustava. Esimerkiksi tekstejä voidaan vetää haluttuun paikkaan. Yksittäiset pylväät voidaan värjätä halutulla värillä tai viivoituksella jne.
 

11.2 Interaktiiviseen grafiikan syntaksi

Standardi grafiikka tarjoaa melko huonot mahdollisuudet tulostaa suuri määrä kuvia samoin asetuksin. Esimerkiksi, jos käyttäjä haluaa tulostaa 20 kuvaa samoilla akselimäärityksillä, on tämä melko hankalaa. Käytettävissä on vain kuvatemplate. Mutta kuvatemplate ei siirrä akselistomäärityksiä, josta seuraa se, että kunkin tulostetun kuvan akselit joutuu standardigrafiikassa editoimaan jälkikäteen. Interaktiivisessa grafiikassa asia hoituu syntaksilla ts. käyttämällä komentokieltä. Seuraavassa on esimerkkikuvaamme vastaava ajovirta:

IGRAPH /VIEWNAME='Bar Chart' /X1 = VAR(gender) TYPE = CATEGORICAL /Y =
  VAR(salary) TYPE = SCALE /COORDINATE = VERTICAL  /X1LENGTH=3.0 /YLENGTH=3.0
 /X2LENGTH=3.0 /CHARTLOOK='C:\Program Files\SPSS11\Looks\Classic.clo'
 /CATORDER VAR(gender) (ASCENDING VALUES OMITEMPTY) /BAR(MEAN) KEY=ON SHAPE =
  RECTANGLE BASELINE = AUTO /ERRORBAR CI(95.0)  DIRECTION = BOTH CAPWIDTH (45)
  CAPSTYLE = T.
EXE.

Komento näyttää aika kauhealta (muistaa), vaan senhän voi generoida lomakkeen Paste-painikkeella. Voimme määrätä y-akseliston rajat asettamalla kohtaan TYPE = SCALE lisämääre (min = 0 max = 100000) ts. ajovirtamme näyttää tältä:

IGRAPH /VIEWNAME='Bar Chart' /X1 = VAR(gender) TYPE = CATEGORICAL /Y =
  VAR(salary) TYPE = SCALE(min=0 max=100000) /COORDINATE = VERTICAL  /X1LENGTH=3.0 /YLENGTH=3.0
 /X2LENGTH=3.0 /CHARTLOOK='C:\Program Files\SPSS11\Looks\Classic.clo'
 /CATORDER VAR(gender) (ASCENDING VALUES OMITEMPTY) /BAR(MEAN) KEY=ON SHAPE =
  RECTANGLE BASELINE = AUTO /ERRORBAR CI(95.0)  DIRECTION = BOTH CAPWIDTH (45)
  CAPSTYLE = T.
EXE.

Tällöin y-akseli päättyy arvoon 100000:


 

12. SPSS-ohjelman asetukset

Komentojen lisääminen tulostuksiin:


Edit > Options...  avaa lomakkeen:

Klikataan Viewer-kohtaa:


 

Ja ruksataan lomakkeen vasemmasta alareunasta löytyvä Display commands in the log-kohta.
 

Ei sivutusta tulostuksiin

 EDIT > OPTIONS .. Avautuvasta lomakkeesta klikataan Viewer-kohtaa ja ruksataan Text Output Page Size / Length-laatikosta ruksataan Infinite-kohta.