Vierasblogi: Puoluegallupit ovat hyödyllisiä – tiheästikin

13.3.2023 — Vieras

Puoluekannatusta mittaavia kyselyitä julkaistaan vaalien lähestyessä yhä tiheämpään tahtiin – ja hyvä niin – mutta miten ne syntyvät ja miten niiden pohjalta voidaan ennustaa vaalien tulosta. Julius Lehtinen kertoo perusasiat

Silmiinpistävä piirre poliittisessa keskustelussa on välillä esiin pulpahteleva epäluuloinen suhtautuminen mielipidemittauksiin ja niiden tiheyteen. Osansa tässä on varmasti tiedotusvälineiden tavalla julkaista desimaalintarkkoja tuloksia puolueiden kannatuksesta, ne kun antavat aivan liian eksaktin mielikuvan mittauksista.

Mittausten olemus on kuitenkin lähempänä hieman suttuista pysäytyskuvaa, jota ei kannata tulkita desimaalin päälle. Monesta ajallisesti lähekkäisestä saa tarkemman kuvan, minkä takia mittauksia suhteellisen tiheään tehdäänkin. Suomen mittaustahti tosin on Länsi- ja Keski-Eurooppaan verrattuna todella harva.

Miten mielipidemittaukset sitten yleisesti ottaen toimivat? Jokaiselta suomalaiselta kysyminen olisi vaivalloista, kallista ja aikaa vievää. Mielipiteen tarkahko kartoitus onnistuu kuitenkin kysymällä pienemmältä, satunnaisesti valitulta joukolta. Se, miksi tuhannelta ihmiseltä kysymällä saadaan selvitettyä miljoonien ihmisten mielipidejakauma, havainnollistuu intuitiivisella esimerkillä.

Ajattele, että sinun tulisi selvittää kruunien ja klaavojen määrä, kun kolikkoa heitetään miljoona kertaa. Oletettavasti pystyt jo ennen heittoja arvioimaan, että jakauma on noin puolet ja puolet, kolikonheiton matematiikka kun on kohtuullisen hyvin tunnettua. Tahdot kuitenkin selvittää asian itse.

Kolmen heiton jälkeen tilanne on joko 2–1 tai 3–0, mikä on suhteellisen kaukana arvioidusta 50 %–50 % jakaumasta. Kymmenen heiton jälkeen tilanne on kuitenkin todennäköisesti tasaisempi. Sadan heiton jälkeen se todennäköisesti on jo huomattavasti lähempänä 50 kruunaa ja 50 klaavaa. Tuhannen heiton jälkeen ollaan suurella varmuudella lähellä miljoonan kolikonheiton jakaumaa.

Yllä kuvattua periaatetta kutsutaan tilastotieteessä suurten lukujen laiksi. Sen mukaan, kun toistetaan satunnaista suoritetta uudestaan, suuremmalla määrällä vastausten keskiarvo hakeutuu kohti oikeata arvoa. Siis satunnaista kolikkoa heittäessä noin puolet kruunaa, puolet klaavaa. Mielipidemittauksissa tarpeeksi monelta satunnaisesti valitulta kysymällä puolueiden tai ehdokkaiden kannatus asettuu lähelle niiden tosiasiallista kannatusta yhteiskunnassa.

Samaa periaatetta siis käytetään mielipidemittausten yhteydessä. Koska ei voida kysyä kaikilta miljoonilta suomalaisäänestäjiltä, kysytään pienemmältä satunnaiselta ryhmältä, joka yllä kuvatun periaatteen mukaisesti antaa suhteellisen tarkan kuvan oikeasta tilanteesta maanlaajuisesti.

Useammalta ihmiseltä kysyminen on tietenkin aina parempi. Hyöty kuitenkin laskee mitä useammalta ihmiseltä kysyy ja viimeistään kahden tuhannen toistokerran kohdalla hyöty alkaa olla pieni. Vastaavasti, jos olet heittänyt kolikkoa jo kaksituhatta kertaa, seuraavat viisisataa heittoa tuskin muuttavat jakaumaa merkittävästi, mutta aiheuttavat vaivaa ja vievät aikaa.

Nyrkkisääntönä Suomen neljän ja puolen miljoonan äänioikeutetun puoluekannan arvioiminen onnistuu alle kahden prosenttiyksikön tarkkuudella, kun mittauksen otanta on kaksi tuhatta henkilöä. Ymmärrettävästi osin keräyskustannuksista johtuen mittauksiin siis jää muutaman prosenttiyksikön virhemarginaali, jonka sisällä todellinen arvo hyvin todennäköisesti on.

Gallupeista ennusteisiin

Ainoastaan kannatusprosenteilla ei kuitenkaan poliittisessa järjestelmässä pötki kovin pitkälle: ne on vaalien tulosta ennustaessa pyrittävä muuttamaan paikoiksi eduskunnassa. Yksinkertaisimmillaan sen voi tehdä kylmästi jakamalla eduskunnan 200 kansanedustajapaikkaa mitattujen kannatusosuuksien mukaisesti. Suomen vaalijärjestelmä ei kuitenkaan ole aivan näin suhteellinen ja suoraviivainen, useat eri mediat, yritykset ja projektit pyrkivät siksi hieman eri tavoin luomaan mahdollisimman tarkan paikkaennusteen.

Yhden (ja kirjoittajalle tutuimman) tavan tehdä tämä tarjoaa Databyro. Se siirtää mitatun puoluekannatuksen vaalipiireihin edellisten eduskuntavaalien perusteella, kertoo sen kansallisen kannatuksen muutoksella ja laskee paikat piireittäin yhteen Suomen vaaleissa käytettävällä D’Hondtin menetelmällä. Sen jälkeen se toistaa prosessin tuhansia kertoja yllä selostetusta virhemarginaalista johtuen hieman eriävillä kannatustuloksilla. Lopputuloksena saadaan ennuste siitä, mihin puolueen paikkamäärä todennäköisesti päätyy.

Erotuksena useimpiin muihin paikkaennusteita tekeviin tahoihin, Databyron ennusteessa mielipidemittausten luontainen epävarmuus on sisäänrakennettuna ja ennustetuiksi paikoiksi ei tarjota vain yhtä lukua. Sen on tarkoitus antaa realistisempi kuva mielipidemittauksiin sekä näin paikkaennusteisiin sisältyvistä epävarmuuksista, jotka ovat aina läsnä.

Mielipidemittausten toiminnan ymmärrys on olennainen osa yhteiskunnallista keskustelua ja näyttelevät suurta roolia myös poliittisessa keskustelussa. Niiden lukutaito auttaa suhteuttamaan mittausten merkityksen ja olemaan menemättä mukaan laajasti uutisoitaviin desimaalien heilahduksiin. Samoin paikkaennusteiden toiminnan ymmärtäminen parhaimmillaan lisää ymmärrystä myös Suomen vaalijärjestelmästä. Se on hyvästä, etenkin näin vaalien alla.

Lue lisää:

Interaktiivinen visualisaatio mielipidemittausten toiminnasta (englanniksi).
Suhonen, Pertti. 2006. Mielipidetutkimukset ja yhteiskunta. Tampere: Tampereen yliopisto.

Julius Lehtinen on gradunsa arpomisen roolista eduskunnan täyttämisessä tehnyt valtiotieteiden maisteri, Europe Elects -vaalianalyysiprojektin pidemmästä julkaisutoiminnasta vastaava päätoimittaja, sekä suomalaisen politiikan analysoimiseen keskittyneen Databyro-projektin luoja.