Correlaciones












- Solía pensar que la correlación implicaba causalidad. Entonces fui a una clase de estadística. Ahora no lo creo.

- Parece que la clase ayudó.

-Bueno, puede ser.

Sé que estos días las entradas son un poco tontas. No tengo mucho tiempo, pero no me he podido resistir a poner este cómic. Como quizá no todo el mundo tiene claro lo que es la correlación, intentaré explicarlo a grandes rasgos, de forma sencilla: pongamos por ejemplo dos variables, como la cantidad de palabras que sabe una persona y su edad. Supongamos que, por norma general, las personas que saben más palabras son precisamente las que tienen mayor edad, y a la inversa, aunque no necesariamente va a cumplirse siempre. Diremos que estas dos variables están correlacionadas. Sin embargo, esto no significa que la edad sea la causa de saber más palabras. Esta es una correlación que no implica causalidad.
La correlación se mide con un número entre 1 y -1. Cuanto más cercana es de cero, menos relación hay entre las variables, cuanto más se aleja de cero la correlación, más relacionadas están, ya sea una relación directa (hacia 1) o inversa (hacia -1). Sin embargo, la correlación nunca llega a 1, porque es una relación que no siempre se cumple. Una relación de causalidad lineal se cumpliría siempre si conseguimos controlar todas las variables.
Por esta razón, debemos tener claro que el hecho de que exista una correlación entre variables, aún cuando esta correlación sea alta, no implica que una sea la causa de la otra.

PD: una correlación, en realidad, si puede ser 1. Ocurre cuando se correlaciona una variable consigo misma, o cuando consideramos dos variables que se relacionan mediante una función lineal.

3 comentarios:

Ernie dijo...

Esa tira es genial XD

Antonio Olives dijo...

Pues por tonta que pueda parecerte la entrada, está bién introducir un recordatorio, sobre todo para la gente que deja de revisar aquello que parece evidente. Esto, que a primera vista parece tan claro, es lo que probablemente el 99% de tus comañeros olvidarán cuando terminen la carrera (como lo olvidaron los míos y muchos otros, especialmente aquellos que se dediquen a la investigación. Si revisas cualquier paper, verás que está lleno de artículos cientifiquísimos en los que constatan que dos elementos están altamente correlacionados y por tanto uno es la causa de otro. Por ejemplo, muchos de los argumentos archiclarísimos están basados en correlaciones. Por ejemplo: la depresión está causada por bajos niveles de serotonina, ahí tienes una argumentación basada en una correlación, que probablemente muchos de los profesores que enseñan estadísica en la facultad, pongan en duda. Luego, nos podemos encontrar con estudios mucho mejores, como alguno que relaciona el tiempo admosférico con la incidencia de autismo, etc...

Cruz dijo...

jeje buena entrada. Hay gente que ha superado las asignaturas de estadística y todavía no lo tiene muy claro...a mí, como dice Antonio, puede ser que se me olvide ^^', pero espero que no. De momento me "chirrían" los oidos cuando escucho argumentos como los que se han dicho en el comentario anterior. ^^

Publicar un comentario en la entrada