Kuppi kuumaa kaakaota: Kuinka gallupeja luetaan

Vanhan sanonnan mukaan tilasto on se kaikkein suurin valhe. Tässä on tiettyä perää, sillä saadakseen oikeaa tietoa tilastoista, niitä on osattava lukea.

Tilastotiede on keskeisessä asemassa useilla tieteenaloilla, koska vain harvat ilmiöt ovat niin yksinkertaisia, että tekemällä yksittäisen mittauksen voitaisiin vetää johtopäätöksiä siitä, mitä saadaan tulokseksi jos mitataan sama asia uudelleen.

Esimerkiksi, SPR:n verenluovutusjonossa kahdella peräkkäisellä henkilöllä tuskin on keskenään samaa hemoglobiiniarvoa, yliopiston pääsykokeessa vierekkäin istuvat tuskin muistavat täsmälleen samoja asioita pääsykoemateriaalista, ja kaksi peräkkäin kadulla kulkevaa toisilleen tuntematonta ihmistä tuskin ovat äänestäneet samaa henkilöä eduskuntavaaleissa. Siksi tarvitaan riittävän iso tutkimusmateriaali, jotta voitaisiin tehdä johtopäätöksiä siitä, miten hyvin tutkimusmateriaalin perusteella saadut tulokset kertovat vaikkapa siitä, mille välille asettuu useimpien terveiden ihmisten hemoglobiinitaso.

Eikä tämäkään vielä riitä. Lisäksi tarvitaan tietoa siitä, millaista jakaumaa tutkittava ilmiö noudattaa, ja miten hyvin siihen vaikuttavat muut tekijät on saatu eliminoitua tutkimuksessa. Jos presidenttigallup tehdään tekniikan alan ensimmäisen vuoden opiskelijoille, saatava tulos todennäköisesti näyttää hieman erilaiselta kuin jos kysytään eiralaisilta eläkeläisiltä tai viitasaareilaisilta sahureilta. Lisäksi mittaustilanteeseen itseensä saattaa liittyä asioita, jotka vaikuttavat tulokseen, esimerkiksi millaisen kuvan haastateltavat haluavat antaa itsestään. Kyselytutkimuksissa on myös oleellista tietää, mitä tarkkaan ottaen on kysytty, koska esimerkiksi kysyttäessä "hyväksytkö kiukuttelevan lapsen tukistamisen" tai "hyväksytkö kuritusväkivallan käytön" vastausten jakauma on taatusti keskenään erilainen, vaikka periaatteessa kysytään samaa asiaa.

Aina ei siis ole itsestäänselvää, mitä ilmiötä tutkimus ylipäätään mittaa, ja vertailtavuus aikaisempiin tutkimuksiin heikkenee, jos tutkimusta itseään jollain tapaa muutetaan.

Nämä asiat on osattava jollain tapaa ottaa huomioon, jotta voitaisiin vetää johtopäätöksiä siitä, mitä saatu tulos kertoo todellisuudesta. Useimmin vastaan tuleva esimerkki tästä on gallup-uutisten sekaan piilotettu pieni lause, joka kertoo kyselyn virhemarginaalin.

Esimerkiksi presidenttigallupin virhemarginaali tarkoittaa sitä, että jos gallup-päivänä kysyttäisiin koko kansan mielipidettä, hyvin suurella todennäköisyydellä tulos poikkeaisi korkeintaan virhemarginaalin verran gallupin antamasta tuloksesta. Jos kyselyn virhemarginaali on 2,5 prosenttiyksikköä kumpaan tahansa suuntaan, kovin isoja otsikoita ei liene tarpeellista tehdä alle 5 prosenttiyksikön kannatuseroista kahden ehdokkaan välillä, eikä myöskään alle 5 prosenttiyksikön noususta tai laskusta yhden ehdokkaan kannatuksessa, koska kyse ei välttämättä ole todellisesta ilmiöstä. Toki vähän pienemmätkin erot on aiheellista noteerata, mutta kovin perustavanlaatuisten johtopäätösten tekeminen niistä osoittaa joko tarkoitushakuisuutta tai eräänlaista lukutaidottomuutta.

Vaaligallupien hyvä puoli on se, että ne tavallaan mahdollistavat yllätykset. Pienet puolueet kärsivät vaaleissa siitä, että monen mielestä niille annettu ääni on hukkaan heitetty ääni, koska omalla ehdokkaalla ei kuitenkaan ole mahdollisuuksia tulla valituksi. Jos gallupit viittaavat voimasuhteiden muutoksiin, omakin ääni on helpompi antaa muutoksen puolesta. Myös medialla on mahdollisuus reagoida kansan kiinnostukseen ja tarjota parempi esillepano yllätyspuolueen edustajalle. Tämä ilmiö auttoi Perussuomalaisia viime eduskuntavaaleissa, ja nyt presidentinvaaleissa se on toiminut Haaviston eduksi. Lipposen kannalta tilanne on toinen - nyt näyttää ensimmäistä kertaa siltä, että demareilla ei todennäköisesti ole ehdokasta presidentinvaalien toisella kierroksella.

Gallupien ongelma on kuitenkin se, että niistä on mahdollista nostaa esiin ilmiöitä, jotka eivät ole todellisia. Näiden presidentinvaalien kisassa siitä, kuka on Niinistön haastaja, tämä on näkynyt erityisen voimakkaasti. Gallupien perusteella erot muiden ehdokkaiden välillä ovat olleet hyvin pieniä, ja kuitenkin juuri nämä tilastollisesti vähäiset tai jopa merkityksettömät erot ovat olleet se, mitä kenties suurimmalla kiinnostuksella on seurattu. Moni miettii nyt, miten tämä vaikuttaa vaalitulokseen.

sunnuntai 22. tammikuuta 2012

Kuinka gallupeja luetaan

Ei kommentteja:

Lähetä kommentti