Tietoyhteiskunta voi toimia vain, jos sen jäsenet osaavat ajatella tieteellisesti. Tilastollinen päättely on tieteellisen ajattelun perusta. Tilastotiede jäsentää tietotulvasta ymmärrettävän maailman ja erottaa tiedon luulosta, toden huuhaasta. Siksi tilasto-osaamisen pitäisi olla kansalaistaito, jonka jokainen oppii koulussa.

Mikä sitten estää tilastotieteen opettamisen koulussa?

Ensinnäkin moni opettaja ei itse osaa edes tilastotieteen alkeita. Tähän on onneksi tehokas ja ilmainen lääke: uusi, kaikille avoin tilastotieteen johdantokurssi verkossa Helsingin yliopiston järjestämänä.

Toiseksi, tarvitaan kouluihin sopivaa tilastotieteen oppimateriaalia. Oppimateriaali kehittyy sopivaksi ennen kaikkea opettajien ja opiskelijoiden välisessä vuoropuhelussa.

Unelmoin siitä, että mahdollisimman yleistajuiset tilastotieteen perusteet olisi jokamiehenoikeutena saatavilla helposti ja ilmaiseksi kaikille.

Vuoropuhelun avauksena yritän seuraavaksi selittää parhaani mukaan, mistä tilastollisessa testauksessa on kyse. Kysymykset, kommentit ja kehitysideat ovat tervetulleita. Palautteen voi jättää nimettömänä kirjautumatta. Luen ajatuksen kanssa jokaisen asiallisen viestin.

Tutkimuksella halutaan selvittää, onko jokin uskomus tosi. Vaikkapa yleinen väite, että naiset puhuvat enemmän kuin miehet. Asian selvittämiseksi kerätään todistusaineisto.

Uskomukset ovat vääriä kunnes toisin todistetaan. Siksi oletamme aluksi, että naiset ja miehet puhuvat yhtä paljon. Todistusaineisto on tuomari, joka sitten kumoaa tai säilyttää tämän lähtöoletuksen.

Tutkimuskysymykseen saataisiin täysin varma vastaus, jos kaikkien ihmisten kaikki puheet ihmiskunnan synnystä sen tuhoon voitaisiin laskea. Tämä on mahdotonta. Joudumme tyytymään otokseen: arvotaan satunnaisesti joukko miehiä ja joukko naisia, ja mitataan kuinka paljon he puhuvat.

Jos valikoimme tarkoituksella erityisen puheliaita tai harvasanaisia naisia tai miehiä, tutkimus vain vahvistaa ennakkoluulomme. Onkin ratkaisevan tärkeää, että tutkitut henkilöt arvotaan kaikkien naisten ja miesten joukosta mahdollisimman sattumanvaraisesti. Vain silloin otoksesta voidaan päätellä, puhuvatko kaikki naiset yhteensä enemmän kuin kaikki miehet yhteensä.

Jokaiseen mittaukseen liittyy virhe. Täysin satunnainenkaan otos ei edusta täydellisesti koko väestöä. Otokseenhan saattaa puhtaasti sattumaltakin valikoitua poikkeuksellisen puheliaita tai harvasanaisia naisia tai miehiä. Mitä suurempi satunnaisotos, sitä pienemmäksi sattuman rooli kuitenkin käy. Joudumme silti aina puhumaan todennäköisyyksistä.

Kun aineisto on kerätty, haluaisimme laskea miten todennäköistä on, että uskomuksemme pitää paikkansa. Valitettavasti sitä ei ole mahdollista laskea. Sen sijaan turvaudumme hieman nurinkuriseen päättelyyn: laskemmekin, miten epätodennäköistä olisi saada vähintään aineistossa havaittu ero puhtaasti sattumalta. Jos eron syntyminen arvonnassa on hyvin epätodennäköistä, päättelemme että uskomus onkin totta.

Eli jos vaikkapa 396 ihmisen satunnaisotoksessa 210 naista puhuu päivässä 16215±7301 ja 186 miestä 15669±8633 sanaa per nenä, laskemme todennäköisyyden sille, että vähintään 16215 - 15669 = 546 sanan ero syntyy normaalijakaumasta arvottujen 210 ja 186 numeron välille. Tulos on tässä 50%, eli joka toisessa arvonnassa saadaan puhtaasti sattumalta vähintään tutkimuksessa havaittu ero. Naisten ja miesten puheen määrässä ei siis tutkimuksen perusteella ole todellista eroa: otoksessa havaittu pieni ero on sattumaa. Luvut ovat todellisesta, Science-lehdessä julkaistusta tutkimuksesta.

Tutkimuksen mukaan naiset ja miehet vaikuttavat puhuvan yhtä paljon, vastoin yleistä uskomusta jonka mukaan naiset puhuvat kolme kertaa enemmän kuin miehet. Laajemmat tutkimukset vahvistavat, että tilanne vaikuttaa puheen määrään paljon enemmän kuin sukupuoli. Kiitos tilastotieteen, väärä uskomus on jälleen korvautunut tiedolla.