Dunning-Kruger-efekti: Klassinen käyrä on tilastollinen artefakti

 


Ylle piirtämäni Dunning-Kruger-efektiä kuvaava käyrä on ”someälykköjen” 😎 lempilapsi – se tulee vastaan harva se päivä. Pohja nousee jyrkästi ylös (”Minä olen nero!”), keskiporukka tasoittuu ja lopussa notkahtaa alas (”Voi ei, en tiedä mitään...”). Justin Krugerin ja David Dunningin vuoden 1999 tutkimus teki tästä ilmiöstä populaaripsykologisen legendan: osaamattomat eivät tajua omaa osaamattomuuttaan.

Tämä somehitti ei kuitenkaan kestä happotestiä. Dunning-Kruger-käyrä on pääosin tilastollinen artefakti – ei niinkään aivojen metakognitiivinen vika, vaan seurausta siitä, miten dataa käsitellään ja miten rajalliset mittakaavat toimivat. Pureudutaan lyhyesti asiaan.

Miksi käyrä syntyy ilman psykologiaa?

Kolme yksinkertaista mekanismia riittää selittämään kaiken:

1. Parempi-kuin-keskimäärin-efekti 

Ihmiset yliarvioivat kykyjään keskimäärin. Esimerkiksi itsearvioitu älykkyys (IQ) on n. 115–123, kun todellinen keskiarvo on n. 100.

2. Regressio keskiarvoon 

Itsearviointi ja todellinen suoritus korreloivat vain heikosti (r ≈ 0,28–0,33). Kun dataa jaetaan kvartiileihin tai lasketaan eroja, ääripäät vetäytyvät automaattisesti kohti keskiarvoa – matalimmat yliarvioivat ja korkeimmat aliarvioivat.

3. Rajaehdot (0–100 tai prosenttipisteet)

Jan R. Magnus ja Anatoly A. Peresetsky (2022) rakensivat yksinkertaisen Tobit-mallin, jossa itsearvio on sidottu välille 0–100. Pelkkä satunnaisvirhe plus nämä rajat tuottavat S-muotoisen käyrän, joka sopii alkuperäiseen dataan lähes täydellisesti. Ei tarvita metakognitiivista sokeutta – vain matematiikkaa.

Kun simuloit satunnaisdataa samoilla rajoitteilla, saat täsmälleen saman käyrän kuin alkuperäisessä tutkimuksessa.

Mitä ankarammat testit kertovat?

Gilles E. Gignac ja Marcin Zajenkowski (2020) testasivat asiaa 929 aikuisen otoksella (Advanced Raven’s Matrices + itsearvio). Klassinen kvartiilijako näytti tukevan Dunning-Kruger-efektiä, mutta oikeat menetelmät (Glejser-testi heteroskedastisuudelle + kvadraattinen regressio) osoittivat, että yhteys on täysin lineaarinen. Virhevariaatio vakio kaikilla tasoilla – efektiä ei siis ollut.

Vuonna 2024 Gignac jatkoi analyysia kahdella isolla otoksella (n ≈ 3500). Jos mitään Dunning-Kruger-tyyppistä yliarviointia on ylipäätään olemassa, se rajoittuu n. 0,2 prosenttiin väestöstä.

Kotiläksy

Dunning-Kruger-käyrä on heivattu roskakoriin.

Anssi H. Manninen (aka ”Kant II”)

Lue myös: 

Saganin standardin kumous: Loogis-filosofinen analyysi

P-arvon ja Cohenin d:n filosofia: Matemaattisesta totuudesta tulkinnan mielivaltaan

 

 


Kommentit

Tämän blogin suosituimmat tekstit

Ozempic oikeustaisteluissa: Miljardien dollarien korvausvaateet vatsahalvausten ja näönmenetysten vuoksi

Ketogeeninen ruokavalio ja sydän: Kritiikkiä tulosten raportoinnista

Valheenpaljastuksen tapaustutkimus nro 1: Jari Sillanpään anteeksipyyntö syynissä