¿Matan las películas de Nicolas Cage?

Correlación no implica causalidad

385 palabras

Hemos visto en otros artículos como establecemos relaciones ilusorias entre eventos que no guardan ninguna relación. En estos casos caemos en un error muy frecuente: establecemos una relación de causalidad entre dos eventos que tienen tendencia a presentarse de manera conjunta. Creemos que si aparecen juntos es porque uno causa al otro.

A veces es así, pero en muchas ocasiones no, porque correlación no implica causalidad (aunque sí que ayuda).

Esta confusión es frecuente porque causalidad siempre implica correlación, pero no al revés. Esto significa que siempre que un fenómeno causa otro, es lógico que aparezcan de manera conjunta. Pero el hecho de que dos eventos se produzcan de manera consecutiva no implica que uno sea causa del otro. De lo contrario podríamos llegar a la conclusión de que la desaparición de los piratas causa el calentamiento global, que el consumo de chocolate hace que un país tenga más premios nobel o que el tamaño de la polla influya en el PIB.

Entonces ¿Por qué hay correlación entre variables que no tienen relación de causalidad?

Cuando tenemos gran número de variables siempre es posible que haya correlaciones por puro azar. En esta web tienes algunos ejemplos como la gran correlación entre muertes por ahogamientos y estrenos de películas de Nicolas Cage. Existe correlación pero ¿podemos afirmar que Nicolas Cage causa muertes por ahogamientos?

¿Son variables que se presentan juntas? Sí.

¿Una causa la otra? Parece evidente que no.

También puede deberse a una variable oculta, un evento que no estamos contemplando y que es el verdadero causante. Por ejemplo: Stephen Levitt, en su obra Freakonomics, dio respuesta a un suceso que desconcertaba a buena parte de EEUU: el fuerte descenso del crimen que se produjo en los años 90. Como ocurre siempre, cada cual trató de justificarlo en función de sus sesgos ideológicos estableciendo relaciones espurias. Es decir, explicaciones de causalidad debido a variables que no guardan relación. Pero Levitt halló una explicación mediante la introducción en la ecuación de una variable que nadie había contemplado: la legalización del aborto veinte años antes.

De todos modos, no importan los datos, si la correlación que tenemos delante confirma nuestra opinión previa, la daremos por válida —por el fantástico sesgo de confirmación—. Otra forma de establecer correlaciones ilusorias o espurias viene del interesantísimo sesgo del superviviente.