Ver pel¨ªculas de Nicolas Cage aumenta el riesgo de ahogarse en la piscina
Saber leer las estad¨ªsticas y entrenar el esp¨ªritu cr¨ªtico servir¨¢ para no confundir casualidad con causalidad
Un estudio afirma que los ni?os que duermen con la luz encendida tienen m¨¢s posibilidades de padecer miop¨ªa. Otro vincula la cifra de ahogamientos en Estados Unidos con el n¨²mero de pel¨ªculas realizadas por Nicolas Cage. De los dos ejemplos, ?cu¨¢l le da m¨¢s confianza? Muchos apuntar¨¢n a la de los ni?os y la miop¨ªa, mientras echan unas risas con la del actor americano. Si usted est¨¢ entre ellos, acaba de caer en una trampa. Extra¨ªdas de dos estudios distintos, estas dos afirmaciones, basadas en la correlaci¨®n de hechos inconexos, son igual de inv¨¢lidas. La primera, publicada en un estudio de la revista Nature, y la segunda en Spurious correlations, un blog de estad¨ªsticas absurdas a cargo de un estudiante de Derecho de Harvard, llevan a la misma confusi¨®n: dar por hecho una relaci¨®n de causa-efecto entre dos acontecimientos consecutivos.
La frase de ¡°todo est¨¢ interconectado¡±, t¨ªpica del pensamiento m¨¢gico, encuentra su contestaci¨®n en la no menos famosa ¡°la correlaci¨®n no implica causalidad¡±. Esta conocida sentencia, presente en toda buena clase de estad¨ªstica y probabilidad, es propia del kit de pensamiento esc¨¦ptico, para discernir cu¨¢ndo una informaci¨®n o un dato son ciertos. Pero, aunque lo haya o¨ªdo mil veces en lat¨ªn, ¡°post hoc ergo propter hoc¡±, o en ingl¨¦s, ¡°correlation is not a cause¡±, bajo las siglas CINAC, usted no puede evitar que en su d¨ªa a d¨ªa le cuelen informaciones como certeras cuando no lo son.
La clave, se?ala el matem¨¢tico Miguel ?ngel Morales, autor del blog Gaussianos, est¨¢ en saber que una correlaci¨®n fuerte entre dos variables no significa que una de ellas sea la causa de la otra, aunque en alg¨²n caso lo pueda ser. ¡°No significa que si se encuentra una correlaci¨®n entre dos variables debe descartarse que una sea causa de la otra. Hay casos en los que A es la causa de que ocurra B, en otros es al rev¨¦s, en otros hay alguna variable adicional la que hace que se produzca, y a veces todo es fruto de la casualidad. El problema de creer que una fuerte correlaci¨®n implica una cierta relaci¨®n causal entre las variables es que extraigamos conclusiones equivocadas, que nos traguemos alg¨²n enga?o o que le atribuyamos ciertas propiedades a alg¨²n producto que en realidad no tiene, ya que no es demasiado dif¨ªcil encontrar este v¨ªnculo entre dos variables que en principio no est¨¢n relacionadas¡±, matiza Morales.
¡°El problema de creer que una fuerte correlaci¨®n implica una cierta relaci¨®n causal es extraer conclusiones equivocadas, tragarnos un enga?o o atribuir ciertas propiedades irreales a un producto¡±, Miguel ?ngel Morales
Para llamar la atenci¨®n sobre la fragilidad de creer en los datos sin una interpretaci¨®n meditada, las estad¨ªsticas absurdas de Spurious Correlations, del analista en inteligencia militar Tyler Vigen, se ponen a su alcance para que usted mismo descubra el lado oscuro de la correlaci¨®n, a base de variables dispares y disparatadas. Junto al ejemplo de los ahogamientos y las pel¨ªculas de Cage, otras correlaciones espurias no menos sorprendentes vinculan el consumo de queso con las personas que mueren estrangulas por las s¨¢banas, el consumo de margarina con el n¨²mero de divorcios en el Estado de Maine (EE UU) o los suicidios por ahorcamiento, estrangulamiento y asfixia con el gasto en ciencia, espacio y tecnolog¨ªa.
La raz¨®n de cometer el error no solo reside en que la mayor¨ªa de la gente carece de un adecuado entrenamiento en el razonamiento probabil¨ªstico y estad¨ªstico, se?ala David R¨ªos, director de la C¨¢tedra AXA en An¨¢lisis de Riesgos Adversarios en el Instituto de Ciencias Matem¨¢ticas ICMAT-CSIC: ¡°Tambi¨¦n puede deberse a un comportamiento no ¨¦tico de qui¨¦n nos da la informaci¨®n, motivado por intereses econ¨®micos (por ejemplo, que realicemos compras o inversiones), pol¨ªticos (que conduzca a decisiones que puedan interesar a un grupo de presi¨®n) o cient¨ªficos (por la presi¨®n de obtener conclusiones m¨¢s llamativas que puedan ser publicadas en revistas cient¨ªficas)¡±, ilustra.
Un estudio publicado en 2012 en la revista New England Journal of Medicine conclu¨ªa que el consumo de chocolate mejoraba la funci¨®n cognitiva, bas¨¢ndose en una fuerte correlaci¨®n entre el n¨²mero de premios Nobel de una nacionalidad y el consumo per c¨¢pita de chocolate en su pa¨ªs. Y aunque el art¨ªculo fuera criticado por la comunidad cient¨ªfica (entre otros motivos, porque los investigadores no conoc¨ªan el consumo real de los laureados), la noticia del resultado no tard¨® en publicase en la prensa. ¡°Confundir correlaci¨®n y causalidad es uno de los errores habituales al procesar informaci¨®n sobre fen¨®menos de incertidumbre¡±, se?ala R¨ªos, quien a?ade: ¡°Otros ejemplos ser¨ªan el exceso de confianza sobre lo que en realidad sabemos, no considerar las tasas b¨¢sicas al procesar informaci¨®n o confundir el concepto de probabilidades condicionadas (la probabilidad de un hecho A dado un hecho B)¡±.
Correlaci¨®n versus causalidad, el juego de las diferencias
El error est¨¢ en mezclar la ocurrencia simult¨¢nea (en el tiempo y/o en el lugar) de dos fen¨®menos, pensando que uno es causa del otro. Un ejemplo cl¨¢sico y muy adecuado para estas fechas, recuerda R¨ªos, es suponer que el consumo de helados en verano en Denia est¨¦ altamente correlacionado con el n¨²mero de ahogados, por ejemplo, en Benidorm, concluyendo que el consumo de helados cause los ahogamientos. ¡°En realidad en este caso hay una tercera variable, la temperatura, que explica las oscilaciones en ambos factores: a mayor calor en Denia, mayor consumo de helados all¨ª, pero tambi¨¦n har¨¢ m¨¢s calor en Benidorm y mayor cantidad de gente se meter¨¢ en el agua, por lo que, en consecuencia, m¨¢s personas se ahogar¨¢n¡±, explica este experto.
"Creer en una relaci¨®n causal irreal entre dos o m¨¢s variables implica malgastar recursos in¨²tilmente e, incluso, perjudicialmente¡±, David R¨ªos
Otro ejemplo famoso, en clave de humor, es la cita cl¨¢sica que asegura que desde 1860 el descenso de piratas en el mundo ha provocado el calentamiento global. La sentencia, creada por el fundador de la iglesia pastafari, Bobby Henderson, como cr¨ªtica al creacionismo, pone de manifiesto nuestro error habitual de confundir casualidad con causalidad, es decir, que aunque los n¨²meros coincidan (el n¨²mero de piratas decaiga a la que vez la temperatura de la atm¨®sfera suba), no significa que una variable motive la otra.
El mejor ant¨ªdoto para no dejarse llevar por las apariencias de los datos, se encuentra en detectar los matices ¨ªntimos que separan la correlaci¨®n de la causalidad, es decir, saber leer las estad¨ªsticas. La correlaci¨®n estudia la relaci¨®n de fuerza o dependencia entre dos variables, que puede ser diferente en cada caso: las hay positivas, negativas, fuertes o d¨¦biles. Si una de las variables crece, puede que la otra tienda a hacerlo tambi¨¦n (al hacer m¨¢s calor, se venden m¨¢s helados) o a decrecer (al crecer el precio de la gasolina se compra menos).
La causalidad aparece en una situaci¨®n en la que la acci¨®n de una de las variables es la que provoca que se produzca la otra: ¡°Cuando se da un fen¨®meno, se produce el otro, con alta probabilidad y bajo ciertas circunstancias. Una correlaci¨®n alta puede ser indicio de causalidad, sin embargo, tambi¨¦n puede deberse a una tercera variable que cause ambas; o que una de ellas cause una tercera variable que a su vez sea causa de la segunda variable en cuesti¨®n; o que no haya conexi¨®n entre ambas variables y todo sea una coincidencia¡±, expone este catedr¨¢tico.
Entrenar las matem¨¢ticas y el esp¨ªritu cr¨ªtico
¡°Para adoptar una visi¨®n m¨¢s cr¨ªtica de la realidad y ser menos manipulables, parte del mejor entrenamiento es entender la diferencia entre correlaci¨®n y causalidad. Muchas decisiones relevantes dependen de la detecci¨®n de relaciones causa-efecto. Por ejemplo, en medicina, para la introducci¨®n de medicamentos y la prohibici¨®n de h¨¢bitos de consumo; en seguridad a¨¦rea, para la implementaci¨®n de procedimientos de vuelo; en pol¨ªtica p¨²blica, para la puesta en marcha de medidas econ¨®micas. Si creemos que hay una relaci¨®n causal entre dos o m¨¢s variables, cuando en realidad no existe, estaremos malgastando recursos in¨²tilmente e, incluso, perjudicialmente", alerta el matem¨¢tico R¨ªos.
Dicho esto, ?qu¨¦ respuesta dar¨ªa ahora al planteamiento inicial? Si se retoman los dos ejemplos, en el primero, la herencia gen¨¦tica podr¨ªa explicar la mayor probabilidad de que los hijos padecieran miop¨ªa, y los padres miopes podr¨ªan ser los que dejaren la luz encendida del dormitorio, como contradijo despu¨¦s otro estudio publicado tambi¨¦n en Nature. En el segundo, por mucho que ambas variables se den a la vez de forma repetida, la filmograf¨ªa de Nicolas Cage est¨¢ muy lejos de ser el factor detonante de los ahogamientos en piscina en Estados Unidos, y pocos pueden dudar de que la relaci¨®n sea producto de la casualidad.
Para R¨ªos, lo importante es recordar que correlaci¨®n es solo un s¨ªntoma de causaci¨®n, y por tanto, hay que poner en cuarentena toda conclusi¨®n demasiado r¨¢pida. ¡°Es importante valorarla de forma cr¨ªtica y pensar si esta relaci¨®n es relevante o no. Si no es as¨ª, y el fen¨®meno es suficientemente relevante (por ejemplo, detectar que fumar produce c¨¢ncer), se han de realizar estudios aleatorios y controlados para ayudar a dilucidarlo. En ocasiones no son factibles tales estudios y los llamados m¨¦todos de inferencia causal pueden ser de ayuda¡±, anota R¨ªos.
Muchas decisiones relevantes dependen de la detecci¨®n de relaciones causa-efecto: la introducci¨®n de medicamentos, la implementaci¨®n de procedimientos de vuelo o la puesta en marcha de medidas econ¨®micas
La salida a los enga?os basados en datos est¨¢ en saber interpretar gr¨¢ficas y estad¨ªsticas para entender los riesgos y tomar mejores decisiones como consumidores y votantes. ¡°En ocasiones, se nos muestran correlaciones muy forzadas para tratar de inducir en nosotros cierta causalidad, y por no saber interpretar convenientemente los datos presentados, acabamos crey¨¦ndonos algo que posiblemente no sea del todo cierto. Debemos ser muy cautos a la hora de analizar los datos que se nos presentan desde distintas fuentes, ya sean empresas, partidos pol¨ªticos o medios de comunicaci¨®n¡±, concluye.
Tu suscripci¨®n se est¨¢ usando en otro dispositivo
?Quieres a?adir otro usuario a tu suscripci¨®n?
Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.
FlechaTu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.
En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.