As¨ª cierran las encuestas en Madrid: las opciones de ganar de derecha e izquierda
Una mayor¨ªa de PP y Vox es el resultado m¨¢s probable. Pero la suma de PSOE, M¨¢s Madrid y Unidas Podemos mantiene 1 de cada 6 opciones
Este mi¨¦rcoles se publicaron los ¨²ltimos sondeos que podr¨¢n publicarse sobre las elecciones en la Comunidad de Madrid del 4 de mayo. Esas encuestas mantienen primero al PP (que ronda el 41% de los votos), seguido de PSOE (21%), M¨¢s Madrid (16%), Vox (9%-10%), Unidas Podemos (7%) y Ciudadanos (4%). A continuaci¨®n ofrecemos la ¨²ltima predicci¨®n de EL PA?S a partir de las encuestas difundidas.
Antes, conviene fijarse en las tendencias de los ¨²ltimos d¨ªas. En la derecha, el ¨²nico movimiento es un ligero descenso de Ciudadanos ¡ªque se aleja m¨¢s del 5% y reduce sus opciones de lograr representaci¨®n¡ª, pero en la izquierda hay uno m¨¢s claro: el PSOE ha perdido 5 o 6 puntos desde marzo, mientras que M¨¢s Madrid se eleva del 11% al 16%.
El resultado de las elecciones depende de un duelo entre dos porcentajes: la suma de votos de PP y Vox (que ronda el 50%) y la de PSOE, M¨¢s Madrid y Podemos (45%). La diferencia se ha reducido de seis a cinco puntos en los ¨²ltimos d¨ªas, pero la izquierda todav¨ªa necesita sorprender a los sondeos para imponerse. Esos tres puntos que tienen que cambiar de bloque, en esencia, determinan las probabilidades de victoria de cada uno.
La predicci¨®n de esca?os
El gr¨¢fico siguiente representa nuestra estimaci¨®n de esca?os a partir del promedio de sondeos. El PP rondar¨ªa los 59 diputados, seguido de PSOE (30), M¨¢s Madrid (23), Vox (13), Unidas Podemos (9) y Ciudadanos (0 de resultado probable; 2 de media).
Para hacer esta estimaci¨®n usamos un modelo estad¨ªstico y simulamos las elecciones 25.000 veces, tal y como explica la metodolog¨ªa al final del texto. El modelo se alimenta de sondeos e incorpora una pieza clave de informaci¨®n: su acierto hist¨®rico. En Espa?a los sondeos se desv¨ªan del resultado unos dos puntos por partido, de media, y no es raro que cometan errores de tres o m¨¢s puntos con alguno. Por eso es importante conocer su grado de precisi¨®n a la hora de hacer predicciones.
Es f¨¢cil ver la incertidumbre que todav¨ªa rodea estas elecciones. Por ejemplo, seg¨²n nuestros c¨¢lculos el resultado m¨¢s probable del PP son 59 esca?os, pero su intervalo de 90% de probabilidad va desde 49 a 69 asientos. Es decir, que una de cada 20 veces ver¨ªamos al PP por encima (o por debajo) de esa franja. Tambi¨¦n es llamativo el caso de Ciudadanos: la probabilidad de que logre esca?os es solo del 20%, pero si lo hace se llevar¨¢ siete asientos, de manera que de media lograr¨¢ dos (aunque ese resultado exacto es imposible).
La clave: qui¨¦n alcanzar¨¢ la mayor¨ªa
La principal ventaja de tener un modelo de predicci¨®n es que permite atribuir probabilidades a diferentes resultados, algo que los sondeos no pueden hacer por s¨ª mismos. Eso nos permite responder la pregunta fundamental de estas elecciones: ?Qu¨¦ partidos tienen opciones de sumar los 69 diputados necesarios? El gr¨¢fico muestra el resumen:
- 7 de 10 veces (71%) habr¨¢ una mayor¨ªa de derechas (PP y Vox). En las 25.000 simulaciones, esa es la frecuencia con que los dos partidos suman los 69 esca?os que necesitan. La mayor¨ªa en solitario del PP ocurre 1 de cada 20 ocasiones (6%).
- 1 de 6 veces (16%) habr¨¢ una mayor¨ªa de izquierdas (PSOE, MM y UP). Es la probabilidad de que las encuestas se equivoquen en esa direcci¨®n y lo suficiente como para que haya un vuelco.
- 1 de 10 veces (9%) Ciudadanos ser¨¢ decisivo. Es la probabilidad combinada de dos sucesos: (1) que Cs supere el 5% de votos (20% de probabilidad), y (2) que sus esca?os los necesiten derecha e izquierda.
- Y¡ en 1 de 25 veces se producir¨¢ un empate. Como la asamblea reparte un n¨²mero par de asientos, puede pasar que PP-Vox y PSOE-MM-UP empaten a 68 esca?os.
?Qu¨¦ significan estos datos? Las cifras anteriores son probabilidades: las que tiene cada mayor¨ªa de producirse. Dicen que una mayor¨ªa del PP y Vox es el resultado m¨¢s probable, pero es importante no confundir eso con una certeza. Al contrario, este tipo de pron¨®sticos pueden interpretarse como una advertencia: las encuestas dicen que la derecha es favorita, pero cuando en el pasado estuvieron tan seguras como ahora sobre algo, acabaron equivoc¨¢ndose un 20% o 30% de las veces.
Otra forma de verlo es imaginar un ¨¢rbol de alternativas. De cada 100 futuros posibles, los n¨²meros de arriba dicen en cu¨¢ntos gana la derecha y en cu¨¢ntos la izquierda. Lo que no sabemos es cu¨¢l de esos futuros ser¨¢ el nuestro.
Por ¨²ltimo, he calculado la probabilidad de otras situaciones variadas, como que M¨¢s Madrid quede delante del PSOE, que el PP tenga mayor¨ªa absoluta o que Vox no logre esca?os.
Suscr¨ªbete aqu¨ª a la ¡®newsletter¡¯ de Kiko Llaneras donde analiza y explica la actualidad con datos y gr¨¢ficos.
Metodolog¨ªa
Las predicciones las produce un modelo estad¨ªstico basado en sondeos y en su precisi¨®n hist¨®rica. El modelo es similar al que usamos en las elecciones de abril y noviembre de 2019, en M¨¦xico, Francia, el Reino Unido, Andaluc¨ªa o Catalu?a. Funciona en tres pasos: 1) agregar y promediar las encuestas, 2) incorporar la incertidumbre esperada, y 3) simular 15.000 elecciones para repartir esca?os y calcular probabilidades.
Paso 1. Promedio de encuestas. Nuestro promedio tiene en cuenta decenas de sondeos para mejorar su precisi¨®n. El promedio est¨¢ ponderado para dar distinto peso a cada encuesta seg¨²n tres factores: el tama?o de la muestra, la casa encuestadora y la fecha.
Paso 2. Incorporar la incertidumbre de las encuestas. Este es el paso m¨¢s complicado e importante. Se necesita estimar la precisi¨®n esperada de los sondeos. ?De qu¨¦ magnitud son los errores habituales? ?C¨®mo de probable es que se produzcan errores de 2, 3 o 5 puntos? Para responder esas preguntas se estudian cientos de encuestas en Espa?a y miles internacionales.
Calibrar los errores esperados. Primero se estima el error de las encuestas en Espa?a. Se construye una base de datos con todas las elecciones desde 1986. El error absoluto medio (MAE) de los promedios de encuestas ha rondado los 2 puntos por partido. Eso significa que fueron habituales desviaciones de 3 o 4 puntos y que el margen de error (al 95%) se acerca a los siete puntos para partidos alrededor del 30% de votos. Esos errores dependen al menos de dos cosas: del tama?o del partido y de la cercan¨ªa de las elecciones. Para tener en cuenta esos dos factores se recurre a la base de datos de Jennings y Wlezien, publicada en Nature. Se han analizado los errores de m¨¢s de 4.100 encuestas en 241 elecciones de 19 pa¨ªses occidentales. As¨ª se construye un modelo sencillo que estima el error MAE del promedio de votos estimado por las encuestas para cada partido, teniendo en cuenta: 1) su tama?o (es m¨¢s f¨¢cil estimar un partido que ronda el 5% en votos que uno que supera el 30%), y 2) los d¨ªas que faltan hasta las elecciones (porque las encuestas mejoran al final).
Elecci¨®n del tipo de distribuci¨®n. Para incorporar la incertidumbre al voto de cada partido en cada simulaci¨®n se utiliza una distribuci¨®n multivariable. Se usan distribuciones t-student en lugar de normales para que tengan colas m¨¢s largas (curtosis): eso hace m¨¢s probable que sucedan eventos muy extremos. Las ventajas de esa hip¨®tesis la explica Nate Silver: "El nivel de curtosis lo he estimado con la base de datos. Luego defino la matriz de covarianzas de estas distribuciones para que la suma de los votos no sobrepase el 100% (una idea de Chris Hanretty). La incertidumbre la incorporo con 53 distribuciones, una a nivel nacional y otra en cada provincia. La primera distribuci¨®n introduce errores iguales para el voto de un partido en toda Espa?a. Es importante hacerlo as¨ª porque en general los errores de las encuestas son sist¨¦micos e iguales en todos los territorios. Si los asumimos independientes, los errores se cancelan entre provincias y el modelo falla por exceso de confianza. Esto pas¨® con algunos modelos de las elecciones de EE UU en 2016. La segunda parte de la incertidumbre la incorporo sobre cada provincia. Por ¨²ltimo, hay que escalar la amplitud de las matrices de covarianza para que las distribuciones de voto que resultan al final tengan el MAE y la desviaci¨®n est¨¢ndar esperados seg¨²n la calibraci¨®n".
Paso 3. Simular. El ¨²ltimo paso consiste en ejecutar el modelo 15.000 veces. Cada iteraci¨®n es una simulaci¨®n de las elecciones con porcentajes de voto que var¨ªan seg¨²n la distribuci¨®n definida en el paso anterior. Los resultados en esas simulaciones permiten calcular las probabilidades que tiene cada partido de lograr cierto n¨²mero de esca?os, alcanzar la mayor¨ªa, quedar primero, etc¨¦tera.
Por qu¨¦ encuestas. Este modelo se basa por entero en encuestas. Existe la percepci¨®n de que los sondeos no son fiables, pero lo cierto es que las encuestas no lo han hecho mal ¨²ltimamente. En los ¨²ltimos dos o tres a?os han sido bastante precisas en Espa?a, aunque con excepciones, como las elecciones andaluzas de 2018. Las encuestas raramente son perfectas, pero no existe ninguna alternativa que se haya demostrado mejor.
Tu suscripci¨®n se est¨¢ usando en otro dispositivo
?Quieres a?adir otro usuario a tu suscripci¨®n?
Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.
FlechaTu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.
?Tienes una suscripci¨®n de empresa? Accede aqu¨ª para contratar m¨¢s cuentas.
En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.