?Qui¨¦n va a ganar las elecciones en Andaluc¨ªa?
Esta es la predicci¨®n final de EL PA?S a partir de encuestas. Consulta los esca?os de cada partido y en cada provincia, la probabilidad de que entre Vox y las posibles mayor¨ªas
Un promedio de sondeos coloca al PSOE como primera fuerza con alrededor del 33% de los votos, seguido de PP (21,4%), Adelante Andaluc¨ªa (19,5%), Ciudadanos (18%) y Vox (4,7%). Los populares son segundos en la mayor¨ªa de sondeos, pero no ser¨ªa raro ver en ese puesto a Ciudadanos o Adelante Andaluc¨ªa, la coalici¨®n de Podemos e IU.
A partir de estos sondeos, el modelo electoral de EL PA?S permite estimar los esca?os que lograr¨¢ cada partido. El PSOE rondar¨ªa los 40 diputados, aunque puede moverse entre los 35 y los 45 con facilidad, y le seguir¨ªan el PP (21-30), Adelante Andaluc¨ªa (17-25) y Ciudadanos (15-25). El resultado de Vox rondar¨ªa los 2 esca?os, aunque no los tiene asegurados.
Estos pron¨®sticos se han calculado con 10.000 simulaciones de las elecciones andaluzas, usando un modelo estad¨ªstico cuya metodolog¨ªa puede consultarse al final de este texto. El siguiente gr¨¢fico muestra la distribuci¨®n de esca?os en esas simulaciones, donde puede analizarse la situaci¨®n de Vox. Seg¨²n los c¨¢lculos del modelo, el partido de extrema derecha tiene un 29% de probabilidades de quedarse sin representaci¨®n (1 de 3 opciones), pero la mitad de las veces consigue dos o m¨¢s esca?os y una de cada diez veces conseguir¨ªa cinco asientos.
Qui¨¦n alcanzar¨¢ la mayor¨ªa
Estimar votos y esca?os es ¨²til, pero la clave de esta elecci¨®n son las mayor¨ªas: ?qu¨¦ partidos sumar¨¢n una mayor¨ªa suficiente ¡ª55 asientos¡ª para escoger presidente y gobernar? Esa predicci¨®n no pueden ofrecerla las encuestas, pero nuestro modelo s¨ª.
El PSOE tiene muy complicado gobernar en solitario porque apenas tiene una opci¨®n entre 100 de alcanzar la mayor¨ªa absoluta. Pero tampoco es probable una mayor¨ªa hac¨ªa la derecha: la suma de PP y Ciudadanos solo alcanza los 55 diputados con una probabilidad del 3% (que es menos de una opci¨®n entre veinte). Eso deja dos opciones como las m¨¢s sencillas: un acuerdo entre PSOE y Adelante Andaluc¨ªa (que alcanza los 55 diputados con una probabilidad del 96%) o un acuerdo entre PSOE y Ciudadanos (91% de probabilidad).
El escenario es todav¨ªa mejor para Susana D¨ªaz, porque probablemente podr¨¢ elegir socio para buscar la mayor¨ªa. Hay un 88% de probabilidades (casi 9 entre 10) de que el PSOE disponga de esas dos alternativas al mismo tiempo, lo que le permitir¨ªa negociar la investidura con Podemos o Ciudadanos en paralelo, sin estar en manos de uno de los dos.
El resultado provincia a provincia
Los mapas a continuaci¨®n representan los esca?os en juego, probables y (casi) seguros que tiene cada partido en cada circunscripci¨®n:
El voto ¨²til no es un reclamo tan fuerte aqu¨ª como en unas elecciones generales, porque las provincias reparten al menos 11 esca?os y eso hace que los cuatro grandes partidos sean competitivos en todas. A¨²n as¨ª es posible encontrar estrategias para algunos votantes, porque no todos los partidos tienen esca?os en juego en todas las provincias.
Esta tabla resume los mismos resultados:
La lucha por el segundo puesto
Por ¨²ltimo, la tabla siguiente representa la probabilidad que tiene cada partido de quedar en cada puesto por n¨²mero de esca?os. Aunque el PP es el segundo en la mayor¨ªa de encuestas, esa posici¨®n no est¨¢ decidida. El PP tiene un 70% de opciones de ocuparla (7 de 10), pero Adelante Andaluc¨ªa tiene un 17% (1 de 6) y Ciudadanos un 11% (1 de 11).?
Es importante interpretar bien los pron¨®sticos de nuestro modelo. En el caso de los esca?os, por ejemplo, las predicciones tienen horquillas de m¨¢s 10 esca?os, que pueden parecer excesivas, pero que no son caprichosas: reflejan el grado de precisi¨®n de las encuestas en el pasado. Estamos usando la misma metodolog¨ªa de nuestras predicciones en M¨¦xico, Colombia, Catalu?a, Francia, Reino Unido, Pa¨ªs Vasco o Galicia. Estos modelos convierten las encuestas en predicciones probabil¨ªsticas despu¨¦s de estudiar la precisi¨®n hist¨®rica de miles de sondeos. En el caso de las elecciones andaluzas, el modelo asume un error medio de dos puntos por partido.
Metodolog¨ªa de nuestro modelo. Las predicciones las produce un modelo estad¨ªstico basado en sondeos y en su precisi¨®n hist¨®rica. El modelo es similar al que usamos en M¨¦xico, Francia, Reino Unido o Catalu?a. Funciona en tres pasos: 1) agregar y promediar las encuestas en Andaluc¨ªa, 2) proyectar ese promedio sobre cada provincia, 3) incorporar la incertidumbre esperada, y 3) simular 10.000 elecciones para repartir esca?os y calcular probabilidades.
Paso 1. Promediar las encuestas. Nuestro promedio tienen en cuenta una docena de sondeos para mejorar su precisi¨®n. Los datos han sido recopilados en su mayor¨ªa en Wikipedia. Solo se incluyen datos de encuestas publicadas hasta el d¨ªa 26 de noviembre. En el caso del CIS se incluyen dos estimaciones, la original que ha publicado el centro y una estimaci¨®n propia, a partir de sus datos brutos. El promedio est¨¢ ponderado para dar distinto peso a cada encuesta seg¨²n tres factores: el tama?o de la muestra, la casa encuestadora y la fecha.
Peso por muestra. Las encuestas con m¨¢s entrevistas reciben m¨¢s peso, seg¨²n una ley decreciente (pasado cierto umbral, hacer m¨¢s entrevistas aporta poco).
Encuestas repetidas. Ponderamos a la baja las encuestas repetidas de un mismo encuestador. La idea es sencilla: no queremos que una empresa que haga muchas encuestas domine el promedio.
Peso por fecha. El ¨²ltimo factor es el m¨¢s importante: queremos dar m¨¢s peso a las encuestas recientes al calcular el promedio. Para conseguir eso asignamos pesos a los sondeos seg¨²n una ley decreciente exponencial (por ejemplo, en este promedio una encuesta de hace 30 d¨ªas recibe la mitad de peso que una encuesta de hoy). Tambi¨¦n definimos una franja de exclusi¨®n y eliminamos completamente las encuestas anteriores al estudio del CIS a finales de octubre.
Paso 2. Proyectar el promedio a cada provincia. Antes de calcular los esca?os es necesario estimar el porcentaje de votos de cada partido en cada provincia. Para eso hacemos una proyecci¨®n lineal del promedio de votos en toda Andaluc¨ªa sobre cada regi¨®n. La proyecci¨®n tiene en cuenta resultados hist¨®ricos en cada provincia (en las generales del 2016 y las auton¨®micas de 2015), pero tambi¨¦n el sondeo preelectoral del CIS.
Paso 3. Incorporar la incertidumbre de las encuestas. Este es el paso m¨¢s complicado y m¨¢s importante. Necesitamos estimar la precisi¨®n esperada de los sondeos en Andaluc¨ªa. ?De qu¨¦ magnitud son los errores habituales? ?C¨®mo de probable es que se produzcan errores de 2, 3 o 5 puntos? Para responder esas preguntas hemos estudiado cientos de encuestas en Espa?a y miles internacionales.
Calibrar los errores esperados. Primero hemos estimado el error de las encuestas auton¨®micas en Espa?a. Hemos construido una base de datos con encuestas de siete elecciones desde 2012. El error absoluto medio (MAE) de los promedios de encuestas ha rondado los 2 puntos por partido. Eso significa que fueron habituales desviaciones de 3 o 4 puntos y que el margen de error se acerca a los 7 puntos para partidos alrededor del 30% de votos. Como siete elecciones son pocas para extraer conclusiones fuertes, hemos analizado tambi¨¦n el acierto de las encuestas en las elecciones generales desde 1986, que es ligeramente inferior pero muy similar (1,9 puntos de error MAE).
Esos errores dependen al menos de dos cosas: del tama?o del partido y de la cercan¨ªa de las elecciones. Para tener en cuenta esos dos factores hemos recurrido a la base de datos de Jennings y Wlezien, recientemente publicada en Nature. Hemos analizado los errores de m¨¢s de 4.100 encuestas en 241 elecciones de 19 pa¨ªses occidentales. As¨ª hemos construido un modelo sencillo que estima el error MAE del promedio de votos estimado por las encuestas para cada partido, teniendo en cuenta: i) su tama?o (es m¨¢s f¨¢cil estimar un partido que ronda el 5% en votos que uno que supera el 30%), y ii) los d¨ªas que faltan hasta las elecciones (porque las encuestas mejoran al final). Por ejemplo, el error medio esperado para un partido con el 30% de votos cuando faltan dos semanas hasta la elecci¨®n es de 2,8 puntos y el margen de error al 95% de confianza alcanza los 7 puntos.
Distribuci¨®n. Para incorporar la incertidumbre al voto de cada partido en cada simulaci¨®n utilizo uno distribuci¨®n multivariable. Usamos distribuciones t-student en lugar de normales para que tengan colas m¨¢s largas (curtosis): eso hace m¨¢s probable que sucedan eventos muy extremos. Las ventajas de esa hip¨®tesis la explica Nate Silver. El nivel de curtosis lo he estimado con la base de datos. Luego defino la matriz de covarianzas de estas distribuciones para que i) la suma de los votos no sobrepase el 100% (una idea de Chris Hanretty), y ii) consideren correlaciones entre candidatos cercanos (tomando datos del nivel de transferencias entre ellos entre 2015 y 2018, seg¨²n el CIS). Por ¨²ltimo, hay que escalar la amplitud de las matrices de covarianza para que las distribuciones de voto que resultan al final tengan el MAE y la amplitud esperados seg¨²n la calibraci¨®n.
Paso 4. Simular. El ¨²ltimo paso consiste en ejecutar el modelo 10.000 veces. Cada iteraci¨®n es una simulaci¨®n de las elecciones con porcentajes de voto que var¨ªan seg¨²n la distribuci¨®n definida en el paso anterior. Los resultados en esas simulaciones permiten calcular las probabilidad que tiene cada partido de lograr cierto n¨²mero de esca?os, alcanzar la mayor¨ªa, quedar primero, etc¨¦tera.
Por qu¨¦ encuestas.?Nuestro modelo se basa por entero en encuestas. Existe la percepci¨®n de que los sondeos no son fiables, pero lo cierto es que las encuestas no lo han hecho mal ¨²ltimamente. A nivel nacional fallaron por pocos puntos incluso con Trump o con el Brexit, y desde entonces se han estado bastante precisos en muchas elecciones, como pas¨® en M¨¦xico, Brasil, Colombia, Francia, Pa¨ªses Bajos, Pa¨ªs Vasco, Galicia o Catalu?a. Las encuestas raramente son perfectas, pero no existe ninguna alternativa que se haya demostrado mejor.