Wiskundemeisjes

Ionica & Jeanine
 
Slik Internetbureau Rotterdam Internetbureau Rotterdam



  • Laatste Reacties

Categorieën

Archief

Correlatie en causaliteit


In Column, door Jeanine

Deze column verschijnt vandaag in de Volkskrant.

Ik heb een kleine obsessie voor bepaalde koppen in het wetenschapsnieuws in de krant en (vooral!) op internet. Denk aan koppen als “Drink More Diet Soda, Gain More Weight”, waarin een bepaald verband tussen twee fenomenen wordt genoemd, maar tegelijkertijd de suggestie gewekt wordt dat er een oorzakelijk verband bestaat tussen het een en het ander.

santa-coke

De kop lijkt te zeggen dat het drinken van light-frisdranken ervoor zorgt dat je zwaarder wordt, wat natuurlijk onzin is. Er bestaat wel een correlatie tussen aankomen en light-frisdrank drinken, maar de oorzaak-gevolg-relatie ligt precies andersom: mensen die zwaarder worden, zullen eerder de neiging hebben light-frisdrank te nemen.

Denkfouten als deze liggen op de loer als je het verschil tussen correlatie en causaliteit niet genoeg in acht neemt. Als twee fenomenen vaak samen optreden (correlatie), betekent dat niet per se dat het één het ander veroorzaakt (causaliteit). Deze drogreden heeft een mooie naam: cum hoc ergo propter hoc (Latijn voor: met dit, dus vanwege dit).

Er zijn verschillende andere mogelijkheden: misschien veroorzaakt het ander juist wel het één, zoals in het voorbeeld hierboven. Soms is een correlatie gewoon toeval. En soms zijn er een heleboel onoverzichtelijke andere factoren die invloed hebben, zoals bij correlaties in de complexe wereldeconomie.

Of misschien, en dat vind ik de leukste optie: misschien is er een duidelijke derde factor die de beide fenomenen veroorzaakt. Een klassiek voorbeeld is de correlatie tussen het aantal ingezette brandweerlieden en de schade die een brand veroorzaakt. Veroorzaken veel brandweermannen de grotere schade? Nee, natuurlijk niet. Er worden meer brandweermannen ingezet omdat het een grote brand is, en een grote brand levert meer schade op. Maar in veel gevallen ligt het wat subtieler en zie je niet meteen wat er niet klopt.

brandweermannen

Een mooi voorbeeld hoorde ik een tijd geleden in een lezing van voedingswetenschapper Martijn Katan. Hij vertelde over een onderzoek dat uitwijst dat er een correlatie bestaat tussen het risico op dementie en weinig sporten, met als bijbehorende kop: “Sporten doet risico op dementie verminderen”. Maar het zou ook kunnen dat beginnende dementie ervoor zorgt dat je weinig sport. Of er zou een derde factor kunnen zijn, bijvoorbeeld ongezond leven (roken, veel alcohol drinken, vet eten), die vaak samengaat met weinig sporten en bovendien een risicofactor is voor dementie.

Als ik zo’n kop lees, vind ik het leuk er zelf mogelijke derde factoren bij te verzinnen. Gewoon als gedachte-experiment, om eens te kijken hoe waarschijnlijk zo’n verband nou eigenlijk is als je alleen je gezonde verstand gebruikt. Met als bijeffect dat je het artikel kritischer gaat lezen. En vaak blijkt dan tijdens het lezen dat het verband wat subtieler ligt dan de kop suggereert. Soms zal er natuurlijk wèl een oorzakelijk verband zijn, maar daar heb je meer argumenten voor nodig dan het optreden van een correlatie alleen.

Ik denk overigens wel dat er een causaal verband bestaat tussen mijn wiskundige achtergrond en mijn obsessie met deze denkfout. Of zou ook daar een derde factor in het spel zijn? Hmmm.