Mentiras, malditas mentiras y estadística!!

mentirasMark Twain nos dejó muchas cita célebres entre las que me gusta destacar la que da título al artículo, “Hay tres clases de mentiras: las mentiras, las malditas mentiras y las estadísticas”. Y es que ya en otros traté de los efectos de las trampas estadísticas, sobre el sesgo de la muestra y de la trampa de la muestra estadística. Hoy le toca el turno a la correlación.

La correlación de dos variables nos proporciona un índice de cuán lejos está de lo aleatorio la evolución lineal de ambas variables, es decir, si dos variables están muy correlacionadas (en positivo o en negativo), indicará que la variación de una de ellas se producirá en una proporción lineal semejante (o contraria) en la otra. Por poner un ejemplo sencillo, una alta correlación en el nivel de ingresos y el nivel de gastos de una familia vendría a decir que cuantos más ingresos más gastos y viceversa.

Pero lo anterior ya deja entrever dos cosas, la primera que la correlación mide una relación lineal. Este tipo de relaciones gustan mucho en las matemáticas y la estadística porque son muy sencillas de trabajar y generan resultados muy elegantes. Pero no deja de ser una simplificación del mundo real. Y por otro lado algo que aún genera más confusión, sobre todo a la hora de interpretar los resultados, y es que la correlación mide el índice de aleatoriedad que hay entre la evolución de dos variables, esto es, mide su casualidad. En ningún caso podemos confundir esto con un índice de causalidad, es decir, causa-efecto. No podemos concluir, por ejemplo con el ejemplo dado, que si a una familia le aumentamos el nivel de ingresos vaya a aumentar su nivel de gastos (y mucho menos que si aumentamos su nivel de gastos vaya a aumentar su nivel de ingresos). Es por tanto que nunca podremos concluir que una correlación entre variables signifique una relación de causa-efecto entre ellas. Para determinar esto último, se debería manipular independientemente ambas variables y ver el efecto en la otra.

En definitiva, esto de la correlación, al igual que cualquier otro artilugio estadístico, se debe tomar con extrema precaución, y si aún lo anterior no es suficientemente convincente, recomiendo ver el siguiente enlace de Spurius correlations que no deja lugar a dudas.

2 Comments

  1. Es uno de los debates mas potentes en los foros de analisis de datos. Aun recuerdo cuando entre a debatir en uno en base al test de caUSalidad de Granger y terminamos todos poniendonos filosoficos, metafisicos, y hasta religiosos (cada uno con su vertiente). De hecho, hasta susodicho test tiene una denominacion erronea (causalidad). Pero bueno, tal y como resumiria lo que decia uno de los debatientes, la estadistica nos puede ayudar a enterder el mundo (caSUalidad), pero solo el Creador puede conocer realmente la caUSalidad.

    • kico.rangel
      Jul 29, 2014

      ¡Cuánta razón tienes! Pero mientras haya tal analfabetismo estadístico en el mundo, los manipuladores seguirán aprovechando las estadísticas para manipular a los manipulables. Sin ánimo de abusar de la palabra 😉

Submit a Comment

Your email address will not be published. Required fields are marked *