L¨®pez Obrador aumenta su ventaja en las encuestas y tiene un 85% de probabilidades de ganar
Una nueva predicci¨®n electoral de EL PA?S coloca al l¨ªder de Morena como presidente m¨¢s probable (85%), seguido de Ricardo Anaya (12%) y Jos¨¦ Antonio Meade (3%)
El promedio de encuestas aumenta la ventaja de Andr¨¦s Manuel L¨®pez Obrador, candidato de la coalici¨®n Juntos Haremos Historia, que se coloca primero con alrededor del 43% de los votos, seguido de Ricardo Anaya (28%) y Jos¨¦ Antonio Meade (22%). El candidato de la alianza de Morena, Encuentro Social y el Partido del Trabajo es un favorito m¨¢s claro rumbo a las presidenciales del 1 de julio.
De acuerdo al modelo electoral de EL PA?S, L¨®pez Obrador tiene un 85% de opciones de ganar la presidencia, el candidato de Por M¨¦xico al Frente, Ricardo Anaya, un 12% y Jos¨¦ Antonio Meade, del PRI, Partido Verde y Nueva Alianza, un 3%. Eso convierte al candidato de Morena en la opci¨®n con m¨¢s probabilidades y al aspirante del Frente en su principal rival. El priista Meade solo se impone en una de cada 30 simulaciones; Anaya al menos en una de cada diez.
Es importante interpretar bien estas probabilidades y la incertidumbre que representan. La victoria de L¨®pez Obrador es tan probable como lanzar un dado y evitar el seis. Pero eso no es una certeza. Sirve de referencia una estad¨ªstica deportiva: la derrota de L¨®pez Obrador ser¨ªa tan probable como ver fallar un penalti a Cristiano Ronaldo.
Estos pron¨®sticos se calculan a partir de encuestas, usando la metodolog¨ªa de nuestros modelos electorales para Francia, Reino Unido o Espa?a (ver detalles al final). Los modelos convierten las encuestas en predicciones probabil¨ªsticas despu¨¦s de estudiar la precisi¨®n hist¨®rica de miles de sondeos. En el caso de M¨¦xico, el modelo asume un error medio de 3,5 puntos por candidato, que es mayor ahora porque faltan dos meses para los comicios. El margen de error hoy supera los 16 puntos para un candidato con el 40% de votos. Por eso L¨®pez Obrador es favorito ¡ªcon ese 85% de probabilidad¡ª, pero no tiene garantizada su victoria.
La tendencia, a favor de L¨®pez Obrador
El candidato de Morena ha aumentado sus opciones de victoria desde el 31 de marzo del 79% al 85%. La raz¨®n es doble. Le ayuda que se acerque la votaci¨®n ¡ªporque se reduce el espacio para las sorpresas¡ª, pero tambi¨¦n su evoluci¨®n: L¨®pez Obrador ha subido dos puntos en el promedio de encuestas para pasar del 41% al 43% de votos.
El l¨ªder de Morena, que est¨¢ en su tercera campa?a presidencial consecutiva despu¨¦s de las de 2006 y 2012, es el ¨²nico en ascenso desde febrero. All¨ª se trunc¨® la tendencia positiva de Ricardo Anaya, su principal competidor, quien dedic¨® tiempo de su campa?a a defenderse de las acusaciones de la Fiscal¨ªa en un oscuro caso relacionado a una compraventa de una nave industrial. La tendencia positiva de L¨®pez Obrador, adem¨¢s, no se debe a unas pocas encuestas, sino que se refleja en los datos de todas las empresas demosc¨®picas del promedio.
Hemos analizado datos de nueve encuestadoras que hicieron dos o m¨¢s sondeos desde diciembre, y las nueve han observado un crecimiento de L¨®pez Obrador en su ¨²ltimo sondeo. Con Ricardo Anaya ocurre lo contrario: las seis m¨¢s recientes le vieron retroceder. Jos¨¦ Antonio Meade se vio m¨¢s o menos estancado en esos sondeos. Esta posici¨®n lo ha llevado a aliarse con personajes secundarios, como el exsenador Armando R¨ªos Piter, quien buscaba llegar a la boleta v¨ªa una candidatura sin partido.
No obstante, faltan a¨²n dos meses y las encuestas todav¨ªa podr¨ªan moverse mucho, como hicieron por ejemplo en 2012. En abril de aquel a?o los sondeos daban 24 puntos de ventaja a Enrique Pe?a Nieto sobre L¨®pez Obrador, pero en junio esa distancia se redujo hasta los diez puntos y el priista acab¨® ganando la elecci¨®n s¨®lo por siete.
Metodolog¨ªa del modelo. Las predicciones las produce un modelo estad¨ªstico basado en sondeos y en su precisi¨®n hist¨®rica. El modelo es similar al que usamos en Francia, Reino Unido o Catalu?a. Funciona en tres pasos: 1) agregar y promediar las encuestas en M¨¦xico, 2) incorporar la incertidumbre esperada, y 3) simular 20.000 elecciones presidenciales para calcular probabilidades.
Paso 1. Promediar las encuestas. Nuestro promedio tienen en cuenta docenas de sondeos para mejorar su precisi¨®n. Los datos han sido recopilados en su mayor¨ªa por la web Oraculus.mx. El promedio est¨¢ ponderado para dar distinto peso a cada encuesta seg¨²n tres factores: el tama?o de la muestra, la casa encuestadora y la fecha.
Peso por muestra. Las encuestas con m¨¢s entrevistas reciben m¨¢s peso, seg¨²n una ley decreciente (pasado cierto umbral, hacer m¨¢s entrevistas aporta poco).
Efecto de la casa encuestadora. La mayor¨ªa de encuestadoras tienden a dar mejores resultados a un candidato de forma sistem¨¢tica. Es algo razonable: si usan m¨¦todos e hip¨®tesis diferentes, es normal que sus desviaciones sean constantes. El problema es que estos efectos mueven el promedio artificialmente a corto plazo. Una opci¨®n para evitarlo es calcular los ?efectos casa?, la desviaci¨®n sistem¨¢tica de cada encuestadora con cada candidato. Despu¨¦s, al promediar las encuestas, sustraemos (parte de) esa desviaci¨®n del dato de la encuestadora.
Encuestas repetidas. Ponderamos a la baja las encuestas repetidas de un mismo encuestador. La idea es sencilla: no queremos que una empresa que haga muchas encuestas domine el promedio. Al calcular el promedio en una fecha, la encuesta m¨¢s cercana de cada encuestador tiene peso 1, y el resto un peso reducido.
Peso por fecha. El ¨²ltimo factor es el m¨¢s importante: queremos dar m¨¢s peso a las encuestas recientes al calcular el promedio. Para conseguir eso asignamos pesos a los sondeos seg¨²n una ley decreciente exponencial (por ejemplo, en este promedio una encuesta de hace 15 d¨ªas recibe la mitad de peso que una encuesta de hoy). Tambi¨¦n definimos una franja de exclusi¨®n y eliminamos completamente las encuestas con m¨¢s de 60 d¨ªas de antig¨¹edad.
Paso 2. Incorporar la incertidumbre de las encuestas. Este es el paso m¨¢s complicado y m¨¢s importante. Necesitamos estimar la precisi¨®n esperada de los sondeos en M¨¦xico. ?De qu¨¦ magnitud son los errores habituales? ?C¨®mo de probable es que se produzcan errores de 2, 3 o 5 puntos? Para responder esas preguntas hemos estudiado cientos de encuestas en M¨¦xico y miles internacionales.
Calibrar los errores esperados. Primero he estimado el error de las encuestas en M¨¦xico. He construido una base de datos con encuestas de cinco elecciones desde 2000 ¡ªincluyendo las tres presidenciales. El error absoluto medio (MAE) de los promedios de encuestas en M¨¦xico ha rondado los 3 puntos por partido o candidato. Eso significa que fueron habituales desviaciones de 3 o 4 puntos y que el margen de error se acerca a los 8 puntos. Pero tres elecciones son pocas para extraer conclusiones fuertes, especialmente si miramos el acierto de los sondeos en la regi¨®n. Nuestro an¨¢lisis de 24 votaciones en Latinoam¨¦rica eleva el error MAE a 4 puntos. Por eso, queriendo ser cautos, nuestro modelo asume un MAE de 3,5 puntos para M¨¦xico.
Esos errores dependen al menos de dos cosas: del tama?o del candidato/partido y de la cercan¨ªa de las elecciones. Para tener en cuenta esos dos factores hemos recurrido a la base de datos de Jennings y Wlezien, recientemente publicada en Nature. Hemos analizado los errores de m¨¢s de 4.100 encuestas en 241 elecciones de 19 pa¨ªses occidentales. As¨ª hemos construido un modelo sencillo que estima el error MAE del promedio de votos estimado por las encuestas para cada partido, teniendo en cuenta: i) su tama?o (es m¨¢s f¨¢cil estimar un partido que ronda el 5% en votos que uno que supera el 30%), y ii) los d¨ªas que faltan hasta las elecciones (porque las encuestas mejoran al final).
Distribuci¨®n. Para incorporar la incertidumbre al voto de cada partido en cada simulaci¨®n utilizo uno distribuci¨®n multivariable. Uso distribuciones t-student en lugar de normales para que tengan colas m¨¢s largas (curtosis): eso hace m¨¢s probable que sucedan eventos muy extremos. Las ventajas de esa hip¨®tesis la explica Nate Silver. El nivel de curtosis lo he estimado con la base de datos. Luego defino la matriz de covarianzas de estas distribuciones para que i) la suma de los votos no sobrepase el 100% (una idea de Chris Hanretty), y ii) consideren correlaciones entre candidatos cercanos (tomando datos de duelos cara a cara y de segundas opciones). Por ¨²ltimo, hay que escalar la amplitud de las matrices de covarianza para que las distribuciones de voto que resultan al final tengan el MAE y la amplitud esperados seg¨²n la calibraci¨®n.
Paso 3. Simular. El ¨²ltimo paso consiste en ejecutar el modelo 20.000 veces. Cada iteraci¨®n es una simulaci¨®n de las elecciones con porcentajes de voto que var¨ªan seg¨²n la distribuci¨®n definida en el paso anterior. Los resultados en esas simulaciones permiten calcular las probabilidad que tiene cada candidato de ganar.
Por qu¨¦ encuestas.?El modelo se basa por entero en encuestas. Existe la percepci¨®n de que los sondeos no son fiables, pero a nivel nacional fallaron por pocos puntos incluso con Trump y con el Brexit. En otras elecciones recientes dieron menos que hablar porque estuvieron acertados (Francia, Pa¨ªses Bajos, Pa¨ªs Vasco, Galicia, Catalu?a). Pese a la creencia popular, lo cierto es que las encuestas no lo han hecho mal ¨²ltimamente. Las encuestas raramente son perfectas, pero no existe una alternativa que haya demostrado mejor capacidad de predicci¨®n.
Tu suscripci¨®n se est¨¢ usando en otro dispositivo
?Quieres a?adir otro usuario a tu suscripci¨®n?
Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.
FlechaTu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.
?Tienes una suscripci¨®n de empresa? Accede aqu¨ª para contratar m¨¢s cuentas.
En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.