”Correlation does not imply causation” – loogis-filosofinen kumous
”Correlation does not imply causation” (korrelaatio ei implikoi kausaatiota) lienee siteeratuin yksittäinen virke koko tieteessä. Sitä toistetaan kuin mantraa muun muassa tilasto-oppaissa, luennoilla ja tiedepodcasteissa. Mutta kun se heivataan puhtaasti loogiselle dissektiopöydälle, se kuolee välittömästi. Se ei ole vain epätarkka tai liioiteltu – se on suorastaan loogisesti epätosi.
Nopea selitys aloittelijoille: kausaatio eli kausaliteetti = syy-seuraussuhde. Eli että jokin oikeasti aiheuttaa toisen, eikä vain sattumalta tapahdu samaan aikaan. Ja nyt asiaan. 😎
Lauseen tavallinen tulkinta ja puolustus
Ihmiset tarkoittavat sillä yleensä seuraavaa:
”Pelkkä korrelaatio ei riitä todistamaan, että A aiheuttaa B:n, koska voi olla kolmas tekijä, yhteensattuma tai käänteinen kausaliteetti.”
Tämä on täysin totta. Mutta se ei ole sama asia kuin väite ”korrelaatio ei implikoi kausaatiota”. Ensimmäinen on varovaisuusperiaate, jälkimmäinen on ehdoton looginen väite – ja juuri tämä ehdoton muoto on virheellinen.
Looginen analyysi
1. Täydellinen korrelaatio (r = ±1)
Jos kahden ilmiön välillä vallitsee täydellinen korrelaatio kaikissa havainnoissa ja olosuhteissa, vaihtoehdot ovat loogisesti tyhjentävät:
- A aiheuttaa B:n
- B aiheuttaa A:n
- jokin kolmas tekijä C aiheuttaa molemmat
- data on manipuloitu tai määritelmällisesti trivialisoitu [1]
Kaikissa ei-triviaaleissa tapauksissa kausaalinen verkosto on siis olemassa. Väite ”korrelaatio ei implikoi kausaatiota” on siis tässä yhteydessä epätosi – korrelaatio implikoi kausaatiota (tai kausaalista rakennetta) välttämättä.
2. Epätäydellinen mutta vahva korrelaatio
Korrelaatio ei ole riittävä ehto kausaatiolle – se voi olla näennäiskorrelaatio. Mutta jos suoraa kausaatiota on olemassa ja mittaukset sekä olosuhteet ovat kunnollisia, korrelaatio lähes poikkeuksetta näkyy. Jos kausaatiota on, mutta korrelaatiota ei havaita, syynä on aina jokin häiritsevä tekijä (esim. mittausvirhe). Siksi korrelaatio on paras ”ensioire” kausaliteetista, vaikkei se yksin riitäkään.
3. Filosofinen implikaatio
Loogisessa kielessä ”P ei implikoi Q:ta” tarkoittaa, että on mahdollista, että P on tosi mutta Q epätosi.
Mutta ”korrelaatio on olemassa” + ”kausaatiota ei ole olemassa” ei ole loogisesti mahdollinen kaikissa tapauksissa – erityisesti kun korrelaatio lähestyy täydellisyyttä tai kun kontrolloidut olosuhteet sulkevat pois kolmannet tekijät.
Täten yleinen väite ”korrelaatio ei implikoi kausaatiota” on loogisesti epätosi – se pitää paikkansa vain joissakin tapauksissa, ei universaalisti.
Parempia ehdotuksia
- ”Korrelaatio ei yksinään todista kausaatiota.”
- ”Korrelaatio ei välttämättä tarkoita kausaatiota.”
- ”Korrelaatiosta ei voi päätellä kausaatiota ilman lisätodisteita.”
Nämä ovat järkeviä varovaisuusperiaatteita.
Yhteenveto
”Correlation does not imply causation” on klassinen esimerkki lauseesta, joka kuulostaa viisaalta, ja levisi meemiksi – mutta joka on loogisesti virheellinen. Oikea opetus ei ole, että korrelaatio ei implikoi mitään. Oikea opetus on, että korrelaatio implikoi aina jotain – ainakin sen, että jokin kausaalinen rakenne on olemassa – mutta se ei kerro meille vielä, mikä se rakenne on.
Korjattu mantra:
”Correlation is not causation – yet.”
Se on sekä loogisesti kestävä että älyllisesti rehellinen.
Anssi H. Manninen (aka ”Kant II”)
1. Määritelmällisesti trivialisoitu = tilanne, jossa korrelaatio syntyy pelkästään siitä, että muuttujat on määritelty sisältämään toisensa. Esimerkiksi kaikkien alle 18-vuotiaiden lasten osuus alle 18-vuotiaista on aina täsmälleen 100 %” Täydellinen korrelaatio, mutta yhtä tyhjän kanssa – se seuraa suoraan määritelmästä, ei mistään todellisesta syy-seuraussuhteesta.
Lue myös: Saganin standardin kumous: Loogis-filosofinen analyysi

Kommentit
Lähetä kommentti