An��lisis

Exposici��n did��ctica de ideas, conjeturas o hip��tesis, a partir de unos hechos de actualidad comprobados ��no necesariamente del d��a�� que se reflejan en el propio texto. Excluye los juicios de valor y se aproxima m��s al g��nero de opini��n, pero se diferencia de ��l en que no juzga ni pronostica, sino que s��lo formula hip��tesis, ofrece explicaciones argumentadas y pone en relaci��n datos dispersos

Por qu�� la victoria de L��pez Obrador es muy probable, seg��n las encuestas

Un error de los sondeos es posible, pero de 20 puntos es poco frecuente. En M��xico no se han producido desviaciones as�� desde hace d��cadas

Kiko Llaneras

27 jun 2018 - 03:34CEST

Las ��ltimas encuestas, al cierre de esta edici��n, colocan a Andr��s Manuel L��pez Obrador muy cerca de convertirse en el pr��ximo presidente de M��xico. El promedio de sondeos lo sit��a cerca del 49% de votos el pr��ximo domingo, mientras sus rivales quedan descolgados:Ricardo Anaya rondar��a el 27% y el priista Jos�� Antonio Meade se quedar��a en el 21%.

L��pez Obrador tiene una ventaja de 22 puntos, que lo convierte en favorito. Su ventaja se ha reducido ligeramente en la ��ltima semana, pero sigue siendo amplia. De acuerdo al modelo electoral de EL PA?S, el l��der de Morena tiene un 97% de probabilidades de salir elegido presidente. Ricardo Anaya ganar��a un 2% de las veces y Jos�� Antonio Meade menos del 1%. Esta es la ��ltima predicci��n de un modelo estad��stico que venimos actualizando desde principio de 2018. El modelo promedia decenas de encuestas y tiene en cuenta la precisi��n hist��rica de los sondeos en M��xico y otros pa��ses. La metodolog��a es la misma que usamos en Francia, Reino Unido, Espa?a o Colombia.

?Qu�� tendr��a que pasar para que L��pez Obrador no lograse la victoria? Hay dos posibilidades y ninguna es probable. La primera opci��n es que se produjese alg��n fen��meno noticioso que provocase un vuelco electoral. No obstante, faltando s��lo cuatro d��as para la votaci��n, y despu��s de un larga y exhaustiva campa?a, el margen para una sorpresa es ya peque?o. La otra opci��n con la que pueden so?ar Ricardo Anaya o Jos�� Antonio Meade es que los sondeos cometiesen un error may��sculo.

Un error de las encuestas es posible, pero un error de 20 puntos es poco frecuente. En M��xico no se han producido desviaciones as�� recientemente. Desde 2006, el error de las encuestas nunca pas�� de los 3 o 4 puntos en una elecciones presidenciales o legislativas. Solo en 2000 hubo un error que roz�� las dos cifras. Aquel a?o Francisco Labastida rondaba el 46% de votos en las encuestas, pero acab�� logrando s��lo un 36% ��casi 10 puntos menos�� y perdiendo la elecci��n contra Vicente Fox.

Los errores de 20 puntos tampoco son frecuentes en otros pa��ses. Todos tenemos en la cabeza el desacierto de los sondeos con la votaci��n del Brexit o la elecci��n de Donald Trump. Pero aquellos errores fueron de apenas unos puntos porcentuales. Las encuestas del Brexit fallaron s��lo por tres puntos (el promedio del Financial Times, por ejemplo, daba un 49% de votos a la opci��n ?Brexit? y acab�� logrando el 52%). A��n menor fue el fallo de los sondeos en la elecci��n presidencial de 2016 en Estados Unidos: Donald Trump rondaba en los sondeos un 45% del voto popular y acab�� logrando un 46%, apenas un punto m��s. El ��nico error reciente que supero los 10 puntos, al menos entre los sonados, fue el que se produjo en Colombia en 2016, cuando las encuestas minusvaloraron en 14 puntos los votos por el ?no? en el plebiscito sobre los acuerdos de paz con las FARC.

Estos ejemplos sirven para explicar nuestra predicci��n. Nuestro modelo cree que el margen de error para L��pez Obrador es de 11 puntos porcentuales, cuando este cuenta con una ventaja de 22 puntos sobre sus rivales. Por eso es un favorito claro para ganar el pr��ximo domingo: porque una vuelco tan grande no es imposible, pero s�� poco com��n.

El 1 de julio los mexicanos votar��n tambi��n para escoger los diputados y senadores que renovar��n sus dos c��maras legislativas. Los datos de los sondeos, analizados por EL PA?S hace unos d��as, indican que el partido de L��pez Obrador (Morena) podr��a ser el m��s votado en los dos casos y que su coalici��n con Encuentro Social (PES) y el Partido del Trabajo (PT) podr��a conseguir tambi��n la mayor��a en las dos c��maras.

Metodolog��a del modelo de la elecci��n presidencial. Las predicciones las produce un modelo estad��stico basado en sondeos y en su precisi��n hist��rica. El modelo es similar al que usamos en Francia, Reino Unido o Catalu?a. Funciona en tres pasos: 1) agregar y promediar las encuestas en M��xico, 2) incorporar la incertidumbre esperada, y 3) simular 20.000 elecciones presidenciales para calcular probabilidades.

Paso 1. Promediar las encuestas. Nuestro promedio tienen en cuenta docenas de sondeos para mejorar su precisi��n. Los datos han sido recopilados en su mayor��a por la web Oraculus.mx. El promedio est�� ponderado para dar distinto peso a cada encuesta seg��n tres factores: el tama?o de la muestra, la casa encuestadora y la fecha.

Peso por muestra. Las encuestas con m��s entrevistas reciben m��s peso, seg��n una ley decreciente (pasado cierto umbral, hacer m��s entrevistas aporta poco).

Efecto de la casa encuestadora. La mayor��a de encuestadoras tienden a dar mejores resultados a un candidato de forma sistem��tica. Es algo razonable: si usan m��todos e hip��tesis diferentes, es normal que sus desviaciones sean constantes. El problema es que estos efectos mueven el promedio artificialmente a corto plazo. Una opci��n para evitarlo es calcular los ?efectos casa?, la desviaci��n sistem��tica de cada encuestadora con cada candidato. Despu��s, al promediar las encuestas, sustraemos (parte de) esa desviaci��n del dato de la encuestadora.

Encuestas repetidas. Ponderamos a la baja las encuestas repetidas de un mismo encuestador. La idea es sencilla: no queremos que una empresa que haga muchas encuestas domine el promedio. Al calcular el promedio en una fecha, la encuesta m��s cercana de cada encuestador tiene peso 1, y el resto un peso reducido.

Peso por fecha. El ��ltimo factor es el m��s importante: queremos dar m��s peso a las encuestas recientes al calcular el promedio. Para conseguir eso asignamos pesos a los sondeos seg��n una ley decreciente exponencial (por ejemplo, en este promedio una encuesta de hace 15 d��as recibe la mitad de peso que una encuesta de hoy). Tambi��n definimos una franja de exclusi��n y eliminamos completamente las encuestas con m��s de 60 d��as de antig��edad.

Paso 2. Incorporar la incertidumbre de las encuestas. Este es el paso m��s complicado y m��s importante. Necesitamos estimar la precisi��n esperada de los sondeos en M��xico. ?De qu�� magnitud son los errores habituales? ?C��mo de probable es que se produzcan errores de 2, 3 o 5 puntos? Para responder esas preguntas hemos estudiado cientos de encuestas en M��xico y miles internacionales.

Calibrar los errores esperados. Primero he estimado el error de las encuestas en M��xico. He construido una base de datos con encuestas de cinco elecciones desde 2000 ��incluyendo las tres presidenciales. El error absoluto medio (MAE) de los promedios de encuestas en M��xico ha rondado los 3 puntos por partido o candidato. Eso significa que fueron habituales desviaciones de 3 o 4 puntos y que el margen de error se acerca a los 8 puntos. Pero tres elecciones son pocas para extraer conclusiones fuertes, especialmente si miramos el acierto de los sondeos en la regi��n. Nuestro an��lisis de 24 votaciones en Latinoam��rica eleva el error MAE a 4 puntos. Por eso, queriendo ser cautos, nuestro modelo asume un MAE de 3,5 puntos para M��xico.

Esos errores dependen al menos de dos cosas: del tama?o del candidato/partido y de la cercan��a de las elecciones. Para tener en cuenta esos dos factores hemos recurrido a la base de datos de Jennings y Wlezien, recientemente publicada en Nature. Hemos analizado los errores de m��s de 4.100 encuestas en 241 elecciones de 19 pa��ses occidentales. As�� hemos construido un modelo sencillo que estima el error MAE del promedio de votos estimado por las encuestas para cada partido, teniendo en cuenta: i) su tama?o (es m��s f��cil estimar un partido que ronda el 5% en votos que uno que supera el 30%), y ii) los d��as que faltan hasta las elecciones (porque las encuestas mejoran al final).

Distribuci��n. Para incorporar la incertidumbre al voto de cada partido en cada simulaci��n utilizo uno distribuci��n multivariable. Uso distribuciones t-student en lugar de normales para que tengan colas m��s largas (curtosis): eso hace m��s probable que sucedan eventos muy extremos. Las ventajas de esa hip��tesis la explica Nate Silver. El nivel de curtosis lo he estimado con la base de datos. Luego defino la matriz de covarianzas de estas distribuciones para que i) la suma de los votos no sobrepase el 100% (una idea de Chris Hanretty), y ii) consideren correlaciones entre candidatos cercanos (tomando datos de duelos cara a cara y de segundas opciones). Por ��ltimo, hay que escalar la amplitud de las matrices de covarianza para que las distribuciones de voto que resultan al final tengan el MAE y la amplitud esperados seg��n la calibraci��n.

Paso 3. Simular. El ��ltimo paso consiste en ejecutar el modelo 20.000 veces. Cada iteraci��n es una simulaci��n de las elecciones con porcentajes de voto que var��an seg��n la distribuci��n definida en el paso anterior. Los resultados en esas simulaciones permiten calcular las probabilidad que tiene cada candidato de ganar.

Por qu�� encuestas.?El modelo se basa por entero en encuestas. Existe la percepci��n de que los sondeos no son fiables, pero a nivel nacional fallaron por pocos puntos incluso con Trump y con el Brexit. En otras elecciones recientes dieron menos que hablar porque estuvieron acertados (Francia, Pa��ses Bajos, Pa��s Vasco, Galicia, Catalu?a). Pese a la creencia popular, lo cierto es que las encuestas no lo han hecho mal ��ltimamente. Las encuestas raramente son perfectas, pero no existe una alternativa que haya demostrado mejor capacidad de predicci��n.

Tu suscripci��n se est�� usando en otro dispositivo

?Quieres a?adir otro usuario a tu suscripci��n?

A?adir usuario Continuar leyendo aqu��

Si contin��as leyendo en este dispositivo, no se podr�� leer en el otro.

?Por qu�� est��s viendo esto?

Flecha

Tu suscripci��n se est�� usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.

Si quieres compartir tu cuenta, cambia tu suscripci��n a la modalidad Premium, as�� podr��s a?adir otro usuario. Cada uno acceder�� con su propia cuenta de email, lo que os permitir�� personalizar vuestra experiencia en EL PA?S.

En el caso de no saber qui��n est�� usando tu cuenta, te recomendamos cambiar tu contrase?a aqu��.

Si decides continuar compartiendo tu cuenta, este mensaje se mostrar�� en tu dispositivo y en el de la otra persona que est�� usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu�� los t��rminos y condiciones de la suscripci��n digital.

Sobre la firma

Kiko Llaneras

Es periodista de datos en EL PA?S y doctor en ingenier��a. Antes de llegar al peri��dico en 2016 era profesor en la Universitat de Girona y en la Polit��cnica de Valencia. Escribe una newsletter semanal, con explicaciones y gr��ficos del d��a a d��a, y acaba de publicar el libro ��Piensa claro: Ocho reglas para descifrar el mundo��.