La correlació no implica causalitat

1. Cicle de vida

3. Àmbit d'aplicació

Descripció

La següent imatge, creada per Thomas Lumley (@tslumley), mostra totes les possibles combinacions entre dues o més variables que poden explicar la correlació entre dues variables, sense que això impliqui que una variable és la causa de l’altra. Òbviament, una correlació elevada entre dues variables indica que hi ha certa associació entre totes dues, però no vol dir que una variable sigui l’única causa que explica l’altra.

Així, dues variables poden estar correlacionades, però poden donar-se els casos següents:

  • Es pot deure a l’atzar i no existir cap relació entre variables. És el que es coneix com una correlació espúria.
  • Pot ser que les variables sí que estiguin relacionades entre si i que una sigui la causa i l’altra, l’efecte. En funció de com de lineal sigui aquesta relació, la correlació mesurada serà més o menys elevada.
  • Pot existir una variable que sigui la causa de les altres dues variables. Per exemple, els fets «portar paraigües» i «portar botes d’aigua» segurament estan correlacionats però estan causats per un tercer fet, «està plovent».
  • Pot ser que ambdues variables estiguin condicionades per una selecció de casos creada per una altra variable. Per exemple, si per anar a una festa els homes han de disfressar-se, seria possible trobar una correlació elevada entre «va disfressat» i «és un home», la qual cosa no seria extrapolable, tret de la selecció causada pel fet d’estar a la festa.

Enllaç al recurs

https://twitter.com/tslumley/status/1125661624356954112

Enllaços relacionats

Correlació: https://es.wikipedia.org/wiki/correlación

Spurious correlations: https://tylervigen.com/spurious-correlations

Cum hoc ergo propter hoc: https://es.wikipedia.org/wiki/cum_hoc_ergo_propter_hoc