La predicci¨®n con todas las encuestas en Catalu?a
Nuestro modelo estad¨ªstico utiliza decenas de sondeos y 10.000 simulaciones para calcular los esca?os de cada partido y la probabilidad de distintas mayor¨ªas
En 14 d¨ªas los catalanes votar¨¢n en unas elecciones trascendentales. Estos son los pron¨®sticos de nuestro modelo estad¨ªstico basado en sondeos. El modelo agrega docenas de sondeos (publicadas antes del 7 de diciembre) y ha sido calibrado con la precisi¨®n hist¨®rica de miles de encuestas en 200 elecciones de 19 pa¨ªses. La metodolog¨ªa se explica al final.
El gr¨¢fico anterior muestra el promedio de encuestas. ERC sigue siendo el primer partido con el 23% de los votos, pero se le acercan Ciudadanos (21%) y Junts per Catalunya (17%). En el gr¨¢fico pueden observarse los movimientos de las ¨²ltimas semanas: suben Cs, JxCat y PSC y caen CeC, PP y ERC.
A partir de ese promedio de votos el modelo predice los esca?os que lograr¨¢ cada partido. Para eso hace 10.000 simulaciones de las elecciones considerando cada provincia. El gr¨¢fico a continuaci¨®n representa el resultado en esca?os de cada partido.
El modelo dice que ERC rondar¨¢ los 35 esca?os y que le siguen Ciudadanos (29), JxCat (26), PSC (21), CeC-Podem (9), PP (8) y la CUP (8). El gr¨¢fico tambi¨¦n hace evidente la incertidumbre de estas elecciones. Los intervalos al 80% de probabilidad son horquillas de unos diez esca?os. ERC puede moverse f¨¢cilmente entre los 29 y los 41 diputados y el PSC entre 15 y 26. Los comunes, por ejemplo, tienen un 10% de probabilidades de quedarse con s¨®lo 4 esca?os, pero tambi¨¦n un 10% de superar los 13. Estas variaciones pueden parecer excesivas, pero no son caprichosas: vienen determinadas por el acierto hist¨®rico de miles de encuestas que hemos analizado.
Ni siquiera el orden de los partidos est¨¢ garantizado. La tabla siguiente muestra la probabilidad que tiene cada formaci¨®n de acabar en cada puesto. ERC es el partido con m¨¢s esca?os el 75% de las veces, pero Ciudadanos se impone en el 17%. En votos sus n¨²meros est¨¢n a¨²n m¨¢s ajustados: ERC es el m¨¢s votado con un probabilidad del 64% y Cs con el 30%. El motivo de esa diferencia es el sistema electoral catal¨¢n. Los esca?os fuera de la provincia de Barcelona se consiguen con menos votos y eso beneficia a los partidos independentistas porque all¨ª logran mejores resultados.
Las mayor¨ªas posibles
La pregunta fundamental del 21 de diciembre consiste en saber qu¨¦ coaliciones tendr¨¢n una mayor¨ªa de esca?os. ?Qu¨¦ probabilidades tienen distintos partidos de sumar 68 diputados y poder escoger al pr¨®ximo gobierno catal¨¢n? Esa es una predicci¨®n que no pueden hacer las encuestas convencionales, pero que ofrece nuestro modelo electoral. El gr¨¢fico representa la suma de esca?os para distintos partidos en nuestras 10.000 simulaciones del 21D. Son histogramas. La masa a la derecha de los 68 esca?os representa la probabilidad de que una suma de partidos alcance la mayor¨ªa.
Ahora mismo, nuestra predicci¨®n es que los independentistas (ERC, JxCat y la CUP) tienen un 58% de probabilidades de sumar una mayor¨ªa de esca?os. Son poco m¨¢s de la mitad de opciones. Equivale pr¨¢cticamente lanzar una moneda al aire. En el 42% restante de las veces, Cs, PSC, PP y CeC suman 68 esca?os y podr¨ªan buscar un acuerdo para elegir gobierno.
El modelo ve muy complicado que los tres partidos del llamado bloque constitucionalista logren una mayor¨ªa ellos solos. La suma de Cs, PSC y PP ronda el 43% en votos y los 57 esca?os. No es imposible que mejoren sus encuestas hasta alcanza los 68 esca?os, pero es algo que solo pasa 3 de cada 100 veces.
Tampoco est¨¢ asegurada la viabilidad aritm¨¦tica de un pacto entre ERC, CeC-Podem y PSC. No solo es complicado pol¨ªticamente; adem¨¢s s¨®lo suman 68 esca?os un tercio de las veces. La fuga de votos de ERC hac¨ªa JxCat y la ca¨ªda de los comunes en los sondeos ha reducido esta suma.
La otra alternativa al bloque independentista es que ERC gobierne apoyado por JxCat y los comunes. Estos tres partidos suman 68 esca?os el 70% de las veces. Es probable, pero en absoluto seguro. Tan probable como ver encestar un tiro libre en baloncesto. Adem¨¢s en este caso es importante un matiz: la probabilidad de esta suma cae si el bloque independentista no alcanzo la mayor¨ªa. Si ERC, JxCat y la CUP se quedan por debajo de los 68 diputados, las probabilidades de que sumen JxCat, ERC y los comunes caen al 45%. Es decir, en una de cada cuatro simulaciones las dos opciones son imposibles.
En los pr¨®ximos d¨ªas las predicciones del modelo se mover¨¢n. Primero porque la incertidumbre ir¨¢ cerr¨¢ndose y las encuestas ganar¨¢n precisi¨®n. Ser¨¢ as¨ª hasta el ¨²ltimo momento, aunque durante los ¨²ltimos seis d¨ªas no podremos publicar sondeos porque la ley lo proh¨ªbe. Hasta entonces veremos si las encuestas siguen movi¨¦ndose. Esta semana han acercado a ERC y Ciudadanos, han mejorado los pron¨®sticos de Carles Puigdemont y han seguido hundiendo al PP y los comunes. Con todos esos movimientos iremos actualizando nuestra predicci¨®n electoral del 21 de diciembre.
Metodolog¨ªa de nuestro modelo. Las predicciones las produce un modelo estad¨ªstico basado en sondeos y en su precisi¨®n hist¨®rica. El modelo es similar al que usamos en Francia y Reino Unido. Funciona en cuatro pasos: 1) agregar y promediar las encuestas en Catalu?a, 2) proyectar ese promedio sobre cada provincia, 3) incorporar la incertidumbre esperada, y 4) simular 10.000 elecciones para calcular probabilidades.
Paso 1. Promediar las encuestas. El modelo agrega las estimaciones de voto de docenas de sondeos. La mayor¨ªa pueden consultarse en?Wikipedia. Hay dos razones para hacer este promedio: sirve para reducir el error de muestreo y adem¨¢s ofrece una ?cocina? de consenso. El promedio est¨¢ ponderado para tener en cuenta el tama?o de muestra, la empresa encuestadora y la fecha del sondeo.
Paso 2. Proyectar el promedio a cada provincia. Antes de calcular los esca?os es necesario estimar el porcentaje de votos de cada partido en cada provincia. Para eso hacemos una proyecci¨®n lineal del promedio de votos en todo Catalu?a. La proyecci¨®n tiene en cuenta resultados hist¨®ricos en cada provincia (del 26J y el 27S) y los ¨²ltimos sondeos del CIS y del CEO.
Paso 3. Incorporar la incertidumbre de las encuestas. Este paso es el m¨¢s complicado. Tambi¨¦n es el m¨¢s importante. Para predecir el resultado ?m¨¢s probable? basta usar el promedio de votos y estimar los esca?os. Pero si queremos saber qu¨¦ probabilidad tienen distintos resultados necesitamos algo m¨¢s: un modelo probabil¨ªstico. Necesitamos estimar la precisi¨®n esperada para los sondeos en Catalu?a. ?De qu¨¦ magnitud son los errores habituales? ?C¨®mo de probable es que se produzcan errores de 1, 2 o 5 puntos? Para responder esas preguntas hemos analizado el error de miles de encuestas.
Calibrar los errores esperados. Primero he estimado el error de las encuestas en Espa?a. He construido una base de datos con encuestas de 23 elecciones desde 1982 ¡ªincluyendo todas las generales y una docena de elecciones recientes. El error absoluto medio (MAE) de los promedios de encuestas en Espa?a ha rondado los 2,1 puntos por partido. Pero esos errores dependen al menos de dos cosas: del tama?o del partido y de la cercan¨ªa de las elecciones. Para tener en cuenta esos dos factores hemos recurrido a la base de datos de Jennings y Christopher Wlezien. Hemos analizado los errores de m¨¢s de 2.700 encuestas en 198 elecciones de 19 pa¨ªses occidentales. As¨ª hemos construido un modelo sencillo que estima el error MAE del promedio de votos estimado por las encuestas para cada partido, teniendo en cuenta: i) su tama?o (es m¨¢s f¨¢cil estimar un partido que ronda el 5% en votos que uno que supera el 30%), y ii) los d¨ªas que faltan hasta las elecciones (porque las encuestas mejoran al final).
Distribuci¨®n. Para incorporar la incertidumbre al voto de cada partido en cada simulaci¨®n utilizo varias distribuciones multivariables. Uso distribuciones t-student en lugar de normales para que tengan colas m¨¢s largas (curtosis): eso hace m¨¢s probable que sucedan eventos muy extremos. Las ventajas de esa hip¨®tesis la explica Nate Silver. El nivel de curtosis lo he estimado con la base de datos. Luego defino la matriz de covarianzas de estas distribuciones para que i) la suma de los votos no sobrepase el 100% (unaidea de Chris Hanretty), y ii) consideren correlaciones entre partidos cercanos (por ejemplo, ERC y JxCat). Esas correlaciones las he basado en las matrices de transferencias del CIS y de Metroscopia. La incertidumbre la incorporo con cinco distribuciones, una a nivel catal¨¢n y otra en cada provincia. La primera distribuci¨®n introduce errores iguales para el voto de un partido en toda Catalu?a. Es importante hacerlo as¨ª porque en general los errores de las encuestas son sist¨¦micos e iguales en todos los territorios. Si los asumimos independientes, los errores se cancelan entre provincias y el modelo falla por exceso de confianza. Esto pas¨® con algunos modelos de las elecciones de EEUU en 2016. La segunda parte de la incertidumbre la incorporo sobre cada provincia. Por ¨²ltimo, hay que escalar la amplitud de las matrices de covarianza para que las distribuciones de voto que resultan al final tengan el MAE y la desviaci¨®n est¨¢ndar esperados seg¨²n la calibraci¨®n.
Paso 4. Simular. El ¨²ltimo paso consiste en ejecutar el modelo 10.000 veces. Cada iteraci¨®n es una simulaci¨®n de las elecciones con porcentajes de voto que var¨ªan seg¨²n las distribuciones definidas en el paso anterior. Los resultados en esas simulaciones permiten calcular las probabilidades de que haya una mayor¨ªa de ciertos partidos, de que un candidato logre cierto n¨²mero de votos, quede primero, etc.
Por qu¨¦ encuestas.?El modelo se basa por entero en encuestas. Existe la percepci¨®n de que los sondeos no son fiables, pero lo cierto es que a nivel nacional fallaron por pocos puntos incluso con Trump y con el Brexit. En otras elecciones recientes, como las francesas, las holandesas o las de Pa¨ªs Vasco y Galicia, los sondeos dieron poco que hablar porque estuvieron acertados. Las encuestas raramente son perfectas, pero son capaces de predecir elecciones en t¨¦rminos probabil¨ªsticas.?Adem¨¢s,no existe una alternativa que haya demostrado mayor capacidad de predicci¨®n.
Tu suscripci¨®n se est¨¢ usando en otro dispositivo
?Quieres a?adir otro usuario a tu suscripci¨®n?
Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.
FlechaTu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.
En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.