Kun RCT-data loistaa poissaolollaan – regressioepäjatkuvuusasetelma tuo kausaalista näyttöä arjen kynnyksiltä

 


Lääketieteessä ja monilla muillakin aloilla joudutaan usein tekemään kriittisiä päätöksiä ilman kultaista standardia: satunnaistettua kontrolloitua tutkimusta (RCT). Magnesiumlisän anto tehohoidossa on klassinen esimerkki. Fysiologinen logiikka ja havainnot kertovat, että matala magnesiumtaso liittyy rytmihäiriöihin ja huonompiin hoitotuloksiin – joten korjataan se. Mutta onko sen korjaaminen todella hyödyllistä? Vai onko kyseessä pelkkä korrelaatio, joka johtaa harhaan? Osa lukijoista muistanee CAST-tutkimuksen, joka kumosi vuosikymmenten käytännön ja osoitti, että rytmihäiriölääkkeet sydäninfarktin jälkeen itse asiassa lisäsivät kuolleisuutta.

Tuoreessa JAMA Internal Medicine -lehden kommentaarissa pohditaan juuri tätä: miten saada luotettavaa kausaalista näyttöä ilman RCT:tä. Ratkaisuna esitellään regressioepäjatkuvuusasetelma (regression discontinuity design, RDD) – kvasikokeellinen menetelmä, joka hyödyntää luonnollista "kynnystä" päätöksenteossa.

Miten RDD toimii?

Monissa hoitokäytännöissä on selkeä raja-arvo (cutoff), esimerkiksi seerumin magnesiumtaso 2,0 mg/dL (vaihtelee laitoksittain 1,6–2,0 mg/dL). Potilaat juuri kynnyksen alapuolella (esim. 1,99 mg/dL) saavat todennäköisemmin magnesiumlisää kuin juuri yläpuolella olevat (esim. 2,01 mg/dL). Nämä kaksi ryhmää ovat muuten lähes identtisiä – ikään kuin sattumalta "melkein satunnaistettuja", koska ero on niin pieni, että se johtuu lähinnä mittauksen pienestä vaihtelusta tai sattumasta.

RDD vertaa näitä kahta ryhmää (juuri alapuolella vs. juuri yläpuolella) ja katsoo, onko tuloksissa (esim. rytmihäiriöiden määrä) selvä hyppy tai katkeama juuri kynnyksellä. Jos on, se hyppy tulkitaan hoidon aiheuttamaksi vaikutukseksi, sillä muut tekijät muuttuvat sujuvasti molemmilla puolilla. Menetelmä siis arvio paikallisen keskimääräisen hoitovaikutuksen (local average treatment effect, LATE) juuri kynnyksen lähellä olevilla potilailla.

Usein kyseessä on fuzzy-RDD (kuten käsillä olevassa magnesiumtutkimuksessa): kynnyksen ylittäminen ei takaa hoitoa 100 %:sti, vaan todennäköisyys kasvaa (tässä tapauksessa ~15 %-yksikköä). Silti saadaan kausaalinen arvio niistä potilaista, joiden hoito todella muuttuu kynnyksen takia.

Mitä RDD vaatii toimiakseen? Kaksi keskeistä oletusta selitettynä

RDD ei ole taikatemppu – se nojaa vahvoihin oletuksiin, jotka pitää testata. Selitän ne magnesiumesimerkin kautta:

1. Jatkuvuusoletus (continuity assumption) 

Kynnyksen molemmin puolin olevat potilaat ovat muuten identtisiä – paitsi hoidon saannin todennäköisyydessä. Jos hoitoa ei annettaisi kynnyksen perusteella, tulokset (esim. rytmihäiriöiden määrä) muuttuisivat sujuvasti kynnyksen yli mentäessä, ilman mitään hyppyä tai katkeamaa. 

Kuvittele käyrää: x-akselilla magnesiumtaso (1,5 → 2,5 mg/dL), y-akselilla rytmihäiriöiden todennäköisyys ilman hoitoa. Jos jatkuvuus pitää, käyrä on sileä ja jatkuva – ei yhtäkkiä nouse tai laske juuri kohdassa 2.0 mg/dL. Jos käyrässä on hyppy juuri kynnyksellä, se johtuu todennäköisesti magnesiumlisästä, ei jostain muusta salaisesta tekijästä (esim. toinen hoito, joka myös alkaa samasta kynnyksestä). 

Testataan tätä tarkistamalla, onko potilaiden taustatekijöissä (ikä, sukupuoli, muut laboratoriotulokset ym.) hyppyä kynnyksellä. Jos kaikki muuttuu sujuvasti, oletus on uskottavampi.

2. Monotonisuusolettamus (monotonicity assumption) – fuzzy-RDD:ssä erityisen tärkeä 

Kynnyksen ylittäminen ei koskaan vähennä hoidon saamisen todennäköisyyttä kenelläkään. Toisin sanoen: jos magnesiumtaso nousee kynnyksen yli, kukaan ei ala saada vähemmän lisäystä kuin olisi saanut alapuolella. 

Magnesiumesimerkissä useimmat potilaat alle 2,0 saavat lisäystä, useimmat yli eivät. Monotonisuus sanoo, ettei ole ketään, joka saisi lisäystä vain siksi, että magnesium menee yli kynnyksen (esim. "väärän suuntainen" potilas, joka kieltäytyy hoidosta alapuolella mutta suostuu yläpuolella). Kaikki reagoivat kynnykseen samaan suuntaan tai neutraalisti. 

Jos tämä rikkoontuu, arvio vääristyy – siksi fuzzy-RDD arvioi vaikutusta nimenomaan niillä potilailla, joiden hoito todella muuttuu kynnyksen takia.

Nämä oletukset eivät aina pidä paikkaansa (esim. jos lääkärit manipuloivat mittauksia kynnyksen ympärillä), mutta kun ne testataan ja näyttävät pitävän, RDD antaa todella vakuuttavaa kausaalista näyttöä ilman RCT:tä.

Filosofinen vivahde – abduktio ja tiedon rajat

Kliininen päätöksenteko alkaa usein Charles Peircen abduktiosta – parhaan selityksen etsimisestä rajallisella datalla. Lääkäri suorittaa valistuneen arvauksen eli esittää hypoteesin ("magnesiumlisä estää rytmihäiriöitä"), koska RCT:tä ei ole eikä todennäköisesti koskaan tule (halpa, ei-patentoitavissa oleva hoito ilman teollisuuden kiinnostusta). RDD vie tätä abduktiivista päättelyä kohti vahvempaa testausta: se ei korvaa RCT:tä, mutta se emuloi satunnaistamista luonnollisen kynnyksen avulla ja antaa kausaalista näyttöä siellä, missä perinteiset havainnoivat analyysit kompensoivat sekoittavia tekijöitä huonosti.

Regressioepäjatkuvuusasetelma ei ole pelkkä tilastollinen jekku – se on tapa tehdä tiedettä arjen epävarmuudessa. Se korostaa, että kausaalisuus ei aina vaadi laboratoriossa suunniteltua satunnaistamista; joskus riittää tarkkaavainen katse siihen, miten luonto jo itsessään "satunnaistaa" ihmisiä kynnyksillä.

Anssi H. Manninen (aka ”Kant II”)

Lue myös: 

Tilastollinen merkitsevyys vs. kliininen merkittävyys vs. efektikoko

P-arvon ja Cohenin d:n filosofia: Matemaattisesta totuudesta tulkinnan mielivaltaan

 

 




Kommentit

Tämän blogin suosituimmat tekstit

Ozempic oikeustaisteluissa: Miljardien dollarien korvausvaateet vatsahalvausten ja näönmenetysten vuoksi

Ketogeeninen ruokavalio ja sydän: Kritiikkiä tulosten raportoinnista

Valheenpaljastuksen tapaustutkimus nro 1: Jari Sillanpään anteeksipyyntö syynissä