?Qu¨¦ dicen las encuestas en M¨¦xico? Sheinbaum tiene un 89% de probabilidades de ganar
La primera predicci¨®n electoral de EL PA?S sit¨²a como firme favorita a la candidata oficialista, aunque la opositora X¨®chitl G¨¢lvez conserva una opci¨®n entre diez para imponerse por sorpresa
}El promedio de encuestas que elabora EL PA?S coloca a Claudia Sheinbaum como la principal candidata a ganar la presidencia de M¨¦xico, con cerca de 60% del voto estimado, bien por delante de X¨®chitl G¨¢lvez (36%) y Jorge ?lvarez M¨¢ynez (5%). A tres meses de la votaci¨®n, la candidata de Morena es la firme favorita.
Pero, ?qu¨¦ probabilidad tiene de ganar?
Para responder eso hemos construido un modelo de predicci¨®n, similar al que EL PA?S ha usado en las elecciones de 2018 y otra veintena de comicios de distintos pa¨ªses. Como se explica en la metodolog¨ªa, el modelo funciona en tres pasos: (1) partimos del promedio de encuestas anterior, (2) incorporamos cierto grado de incertidumbre alrededor, seg¨²n el acierto hist¨®rico de los sondeos en M¨¦xico, y (3) simulamos las elecciones 20.000 veces para calcular las probabilidades de cada resultado.
Nuestra predicci¨®n dice que Claudia Sheinbaum tiene un 89% de opciones de victoria, pero su rival X¨®chitl G¨¢lvez conserva 1 opci¨®n entre 10 para dar la sorpresa.
Es importante interpretar bien estas probabilidades. Sheinbaum es una favorita clara, y su victoria es diez veces m¨¢s probable que la de G¨¢lvez, pero los sucesos de probabilidad 11% no son imposibles. Sirve de referencia una estad¨ªstica futbol¨ªstica: la derrota de Sheinbaum es m¨¢s probable que ver fallarse los dos primeros penaltis de una una tanda de lanzamientos.
Este diario ya public¨® pron¨®sticos de este tipo en las elecciones presidenciales hace seis a?os. Nuestra primera predicci¨®n dijo en marzo de 2018 que L¨®pez Obrador ten¨ªa un 79% de opciones de ganar; la ¨²ltima, d¨ªas antes de las elecciones, elev¨® sus opciones hasta el 97%, anticipando lo que luego ocurri¨®.
G¨¢lvez recupera terreno
Desde oto?o, las encuestas se han movido para reducir la distancia entre Sheinbaum y G¨¢lvez, desde los 32 puntos de diciembre a los 24 actuales. Por un lado, es evidente un salto adelante de G¨¢lvez, coincidiendo con el desgaste de Movimiento Ciudadano ¡ªal anunciarse que su nominado ser¨ªa Jorge ?lvarez M¨¢ynez y no Samuel Garc¨ªa, que parec¨ªa el favorito en noviembre¡ª. Al mismo tiempo, desde enero se aprecia un ligero retroceso de Sheinbaum, que baja en el promedio del 62% al 60% de intenci¨®n de voto.
Una clave de las pr¨®ximas semanas es seguir la evoluci¨®n de estas tendencias, aunque el colch¨®n de Sheinbaum es considerable.
El error de los sondeos
Los modelos como el nuestro convierten las encuestas en predicciones, gracias a que incorporaci¨®n una informaci¨®n adicional: la precisi¨®n hist¨®rica de los sondeos. ?De qu¨¦ magnitud son sus errores? ?C¨®mo de probable es que fallen por 5 o 15 puntos? Para averiguar eso, hemos analizado decenas de encuestas en M¨¦xico y miles de otros pa¨ªses.
Las encuestas estuvieron bien en las presidenciales de M¨¦xico de 2006 y 2012, pero se desviaron m¨¢s en 2000 y 2018. Aunque hace seis a?os predijeron la victoria de L¨®pez Obrador, lo cierto es que le daban seis puntos menos de los que obtuvo ¡ªy un error de seis puntos, en otras circunstancias, puede cambiar el resultado¡ª. En estas cuatro citas, los sondeos cometieron un error medio por candidato de 3,8 puntos en votos ¡ªconsiderando solo aquellos que superan el 10%¡ª. Es decir, fueron habituales desviaciones de 4 o 5 puntos y el margen de error rond¨® los 9 puntos. Las encuestas fueron mejores en las elecciones legislativas de 2009, 2015 y 2021: all¨ª el error medio fue 2,1 puntos, que es una precisi¨®n alta, similar a la de los sondeos en EE UU o Espa?a. Sin embargo, aplicando un principio de cautela, hemos usado ese primer dato ¡ª3,8 puntos de error¡ª como base para nuestro modelo de predicci¨®n.
Adem¨¢s, nuestra metodolog¨ªa tambi¨¦n ensancha la incertidumbre en funci¨®n del tiempo que falta para la votaci¨®n. A tres meses de la votaci¨®n de junio, el margen de error (al 90%) ronda los 16 puntos para un candidato alrededor del 50% de voto, de ah¨ª que Sheinbaum se mueva alrededor del 90% de opciones.
Metodolog¨ªa
Las predicciones las produce un modelo estad¨ªstico basado en sondeos y en su precisi¨®n hist¨®rica. Uno similar a los que usamos en Espa?a en 2023 y dos veces en 2019, en Andaluc¨ªa, Catalu?a o Madrid. . Tambi¨¦n en M¨¦xico hace seis a?os, en Francia o el Reino Unido. El modelo funciona en tres pasos: 1) agregar y promediar las encuestas, 2) incorporar la incertidumbre esperada, y 3) simular 20.000 elecciones calcular probabilidades.
Paso 1. Promediar las encuestas. Nuestro promedio tienen en cuenta docenas de sondeos para mejorar su precisi¨®n. Los datos han sido recopilados en su mayor¨ªa por la web Oraculus.mx. El promedio est¨¢ ponderado para dar distinto peso a cada encuesta seg¨²n dos factores: la casa encuestadora (las empresas sin trayectoria tienen menos peso; las que no publican sus datos en el INE son excluidas) y la fecha. Queremos dar m¨¢s peso a las encuestas recientes al calcular el promedio, y que el ¨²ltimo d¨ªa solo importan las ¨²ltimas publicadas por cada encuestador. Para eso asignamos pesos a los sondeos seg¨²n una ley decreciente exponencial. Y definimos una franja de exclusi¨®n que ignora las encuestas con m¨¢s de 30 d¨ªas de antig¨¹edad. Adem¨¢s, penalizamos las encuestas repetidas de un mismo encuestador. Al calcular el promedio en una fecha, la encuesta m¨¢s cercana de cada casa tiene peso uno, pero el resto de sus estudios casi se ignoran.
Los promedios como el nuestro pueden verse como una estimaci¨®n de consenso. En lugar de confiar en un ¨²nico encuestador, agregan el criterio y las hip¨®tesis de muchos. Los promedios reducen el ruido, evitando que las tendencias salten arriba y abajo por azar. Y sobre todo: se ha demostrado que mejoran la precisi¨®n.
Paso 2. Incorporar la incertidumbre de las encuestas. Este es el paso m¨¢s complicado y m¨¢s importante. Necesitamos estimar la precisi¨®n esperada de los sondeos en M¨¦xico. ?De qu¨¦ magnitud son los errores habituales? ?C¨®mo de probable es que se produzcan errores de 3, 5 o 15 puntos? Para responder esas preguntas se estudian decenas de encuestas en M¨¦xico y miles internacionales.
Calibrar los errores esperados. Primero he estimado el error de las encuestas en M¨¦xico. He construido una base de datos con encuestas de siete elecciones desde 2000. El error absoluto medio (MAE) de los promedios de encuestas en M¨¦xico, por candidato o partido, considerando aquellos con m¨¢s del 10% de votos, ha rondado los 3,8 puntos en las presidenciales y los 2,2 puntos en las legislativas. Es decir, fueron habituales desviaciones de cuatro o cinco puntos y el margen de error (95%) rond¨® los nueve puntos. Como siete elecciones son pocas para extraer conclusiones fuertes, tambi¨¦n revisamos una veintena de votaciones en otros pa¨ªses de Latinoam¨¦rica, donde el error MAE se elev¨® al 4,1 puntos. Al final, siguiendo un principio de cautela, he decidido que nuestro modelo asuma un MAE de 3,8 puntos en M¨¦xico.
Adem¨¢s, esa incertidumbre se modula teniendo en cuenta dos factores adicionales: el tama?o del candidato/partido (porque es m¨¢s f¨¢cil estimar el voto de un partido si ronda el 5% que si se acerca al 50%) y la cercan¨ªa de las elecciones (porque las encuestas del final son casi siempre m¨¢s precisas). Para ajustar esta parte del modelo he recurrido a la base de datos de Jennings y Wlezien, publicada en Nature, y analizado los errores de 4.100 encuestas en 241 elecciones de 19 pa¨ªses occidentales.
Elecci¨®n del tipo de distribuci¨®n. Para incorporar la incertidumbre al voto de cada candidato/partido en cada simulaci¨®n utilizo una distribuci¨®n multivariable. Uso distribuciones t-student en lugar de normales para que tengan colas m¨¢s largas (curtosis): eso hace m¨¢s probable que sucedan eventos muy extremos. Las ventajas de esa hip¨®tesis la explic¨® Nate Silver. El nivel de curtosis lo he estimado con la base de datos anterior. Luego defino la matriz de covarianzas de estas distribuciones para que la suma de los votos no sobrepase el 100% (una idea de Chris Hanretty). Por ¨²ltimo, hay que escalar la amplitud de las matrices de covarianza para que las distribuciones de voto que resultan al final tengan el MAE y la desviaci¨®n est¨¢ndar esperados seg¨²n la calibraci¨®n.
Paso 3. Simular. El ¨²ltimo paso consiste en ejecutar el modelo 20.000 veces. Cada iteraci¨®n es una simulaci¨®n de las elecciones con porcentajes de voto que var¨ªan seg¨²n la distribuci¨®n definida en el paso anterior. Los resultados en esas simulaciones permiten calcular las probabilidades que tiene cada candidato de ser el m¨¢s votado y alcanzar la presidencia.
Por qu¨¦ encuestas. Este modelo se basa por entero en encuestas. Existe la percepci¨®n de que los sondeos no son fiables, pero lo cierto es que las encuestas funcionan. Las encuestas raramente son perfectas, pero no existe ninguna alternativa que se haya demostrado mejor.
Suscr¨ªbase a la newsletter de EL PA?S M¨¦xico y al canal de WhatsApp electoral y reciba todas las claves informativas de la actualidad de este pa¨ªs.
Tu suscripci¨®n se est¨¢ usando en otro dispositivo
?Quieres a?adir otro usuario a tu suscripci¨®n?
Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.
FlechaTu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.
En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.