Tilastollinen testaus


Jos tutkimus on kohdistettu otokseen, on tarkasteltava pitävätkö tulokset paikkansa koko perusjoukossa. Tarkastelu tapahtuu tilastollisin testein.

Ennen päätöksentekoa on muodostettava jokin ennakkokäsitys perusjoukon ominaisuudesta. Tätä ennakkokäsitystä sanotaan tilastolliseksi hypoteesiksi.

Testattava hypoteesi on nollahypoteesi H0 ja siitä poikkeavaa hypoteesia sanotaan vastahypoteesiksi H1. Toisen on oltava aina voimassa.

Eri asioita testataan erilaisilla testeillä. Jokaisella testillä on oma testattava hypoteesi H0 ja vastahypoteesi H1.

Testauksen vaiheet

  • hypoteesien asettaminen
  • tilastollisen testin valinta
  • testin suorittaminen
  • tulosten tulkinta
  • johtopäätöksen tekeminen

Yleisesti voidaan sanoa hypoteesien olevan muotoa:

H0: ei riippuvuutta, eri eroa, keskiarvot ovat yhtä suuret
H1: on riippuvuutta, on eroa, keskiarvot poikkeavat toisistaan

Pienet erot tai riippuvuudet eivät vielä riitä nollahypoteesin hylkäämiseen, vaan niiden on oltava niin suuria, ettei niitä tulkita sattumasta johtuviksi.

On mahdollista laskea todennäköisyys (p) sille, että pelkkä sattuma aiheuttaisi jonkin tietyn säännönmukaisuuden esim. kahden muuttujan riippuvuuden. Jos tämä todennäköisyys (sanotaan merkitsevyystaso, ristitaso eli p-arvo) on pieni, voidaan uskoa, että tulokset (esim. riippuvuus) pätevät myös perusjoukossa eli tulokset ovat niin sanotusti tilastollisesti merkitseviä. Riskitaso ilmoittaa siis, kuinka suuri on riski, että saatu esim. riippuvuus johtuu sattumasta.

Ennen testausta päätetään, mikä on se raja, jonka alle merkitsevyystason eli riskitason on jäätävä ennen kuin nollahypoteesi H0 hylätään.
Yleisesti käytettyjä rajoja ovat 0,05 (5%), 0,01 (1%) ja 0,001 (0,1%). Tilastollisessa kielenkäytössä esiintyvät seuraavat tulkinnat:

Jos 0,01 < p < 0,05 niin testitulos on tilastollisesti melkein merkitsevä
0,001 < p < 0,01 niin testitulos on tilastollisesti merkitsevä
p < 0,001 niin testitulos on tilastollisesti erittäin merkitsevä

SPSS tulostaa testille tarkan merkitsevyystason arvon Sig (Significance Level p).

Tulosta ilmoitettaessa usein käytetään vain ilmausta tilastollisesti merkitsevä eikä käytetä ilmaisua melkein merkitsevä. Jos testissä saatu merkitsevyystaso on esim. 0,03, niin molemmat seuraavat ilmaisut tarkoittavat samaa:
”Ero on tilastollisesti merkitsevä 5 %:n merkitsevyystasolla” ja
”Ero on tilastollisesti merkitsevä (p < 0,05)”

Yleensä kuitenkin laitetaan näkyviin ohjelman laskema tarkka merkitsevyystaso:
Ero on tilastollisesti merkitsevä (p=0,03).

Esimerkiksi

  • Poikien testipisteiden keskiarvoksi saatiin 14,5 ja tyttöjen keskiarvoksi 16,0. Keskiarvojen välinen ero on tilastollisesti merkitsevä (p=0,026). Tytöt pärjäsivät testissä paremmin.
  • Tyytyväisyys tilaisuuden ohjelmaan ei riippunut tilastollisesti merkitsevästi sukupuolesta (p=0,072).