?Qui¨¦n ganar¨¢ el mundial? As¨ª hacemos la predicci¨®n de EL PA?S
Explicamos c¨®mo funciona nuestro modelo estad¨ªstico
Si a¨²n no lo has hecho, consulta primero la predicci¨®n completa. A continuaci¨®n tienes una descripci¨®n detallada de c¨®mo hacemos esa predicci¨®n.
?Qu¨¦ opciones tiene cada selecci¨®n de ganar el mundial? Esa es la pregunta que intentamos responder con nuestro modelo estad¨ªstico. Simulamos el torneo miles de veces para calcular qu¨¦ probabilidad tiene cada equipo de llegar a octavos, jugar las semifinales o llevarse el torneo. As¨ª podemos decir qu¨¦ equipos son favoritos, pero tambi¨¦n en qu¨¦ medida lo son. El modelo se alimenta de un ranking propio que ordena a las selecciones seg¨²n su fortaleza, usando datos de cada selecci¨®n y sus jugadores.
El modelo de predicci¨®n tiene tres partes fundamentales: 1) un ranking que mide la fuerza de cada selecci¨®n, 2) un modelo estad¨ªstico para estimar los posibles resultados de cada partido, y 3) un simulador de la competici¨®n. A continuaci¨®n puedes leer los detalles.
1. El ranking de EL PA?S
Para medir la fortaleza de cada selecci¨®n usamos un ranking. A cada equipo le asignamos una puntuaci¨®n, de forma que los mejores tienen m¨¢s puntos. La base de nuestro ranking es un m¨¦todo Elo, inspirado en el que se emplea en ajedrez y otros deportes. Usamos, en realidad, una media de tres rankings Elo diferentes: 1) uno ¡°cl¨¢sico¡±, que solo tiene en cuenta los resultados de cada selecci¨®n, 2) otro basado en las ocasiones de gol producidas y concedidas, que llamamos ¡°Elo esperado¡±, y 3) un ¡°Elo de jugadores¡±, con datos de las plantillas de cada selecci¨®n.
Ranking Elo cl¨¢sico (peso 50%). El ranking Elo cl¨¢sico mide la fuerza de cada equipo seg¨²n sus resultados. Cada equipo tiene cierta cantidad de puntos ¡ªsus puntos Elo¡ª y cuando se juega un partido se produce un intercambio. El ganador se lleva puntos del perdedor. Si la victoria es por sorpresa (porque se impone el equipo d¨¦bil) los equipos se intercambian m¨¢s puntos. El intercambio tambi¨¦n es mayor si la victoria es por varios goles ¡ªporque es una se?al de superioridad¡ª y cuando el partido enfrenta a selecciones punteras. Tambi¨¦n damos m¨¢s peso a los partidos m¨¢s importantes, como fases finales o torneo continentales. Los ranking Elo funcionan bastante bien y se usan cada vez m¨¢s. Para calcularlo hemos utilizado datos de 32.000 partidos y 159 selecciones.
Ranking Elo esperado (peso 30%). El segundo ranking es igual que el anterior, pero en lugar de alimentarse del resultado real de cada partido se alimenta del ¡°resultado esperado¡±. Para eso usamos la m¨¦trica estrella de la anal¨ªtica avanzada: los goles esperados. Esta estad¨ªstica dice cuantos goles deber¨ªa haber marcada un equipo (en media) con los remates que hizo en un partido, teniendo en cuenta muchos detalles de cada disparo, como la distancia, el ¨¢ngulo, el tipo de remate o la jugada precedente. En este video se explica muy bien qu¨¦ son y para qu¨¦ sirve los goles esperados. Para construir este ranking usamos datos de goles esperados de m¨¢s de 200 partidos de selecciones disputados desde 2017. Los datos nos los proporciona la empresa especializada en estad¨ªsticas deportivas Opta Sports.
El ranking Elo esperado nos sirve para reducir el efecto de la suerte. Sabemos que a veces se pierden o se empatan partidos que has dominado. El ranking Elo cl¨¢sico ignora esos matices, pero la estad¨ªstica de goles esperados los incorpora a nuestro modelo. No es una m¨¦trica perfecta, pero es un buen complemento. Especialmente en el caso de las selecciones, porque juegan pocos partidos y una derrota injusta puede costarles muchos puntos de Elo cl¨¢sico.
Ranking Elo de jugadores (peso 20%). Nuestro tercer ranking explota la informaci¨®n disponible sobre los jugadores de cada selecci¨®n. ?Por qu¨¦ usamos esto? Por lo mismo que dec¨ªamos hace un momento, las selecciones juegan pocos partidos y eso complica medir su rendimiento solo con sus resultados m¨¢s recientes. Por eso es ¨²til alimentar el modelo con otra informaci¨®n reciente. El ranking Elo lo construimos con dos datos de cada jugador: su valor en el mercado de fichajes y la fortaleza del club al que pertenece. La calidad de los clubs la medimos tomando su puntuaci¨®n Elo en la web Clubelo. Los valores de mercado provienen de Transfermarkt. Por ejemplo, seg¨²n Estos datos, el jugador m¨¢s valioso del mundial juega en Argentina: Lionel Messi que pertenece al club m¨¢s fuerte (el FC Barcelona, que tiene un Elo de 2025) y es uno de los jugadores m¨¢s caros de todos (est¨¢ valorado en 180 millones de euros). Para los clubs que no aparecen en Clubelo hemos construido un modelo sencillo que estima su puntuaci¨®n Elo a partir del valor de mercado de sus plantillas. Para construir este ranking usamos datos de 352 clubs y 800 jugadores.
2. El modelo de partidos
Una vez tenemos el ranking de cada selecci¨®n, el siguiente paso es construir una f¨®rmula para predecir los resultados posibles de cualquier partido. Para eso hemos ajustado un modelo sencillo que estima los goles que marcar¨¢ cada equipo en funci¨®n de dos par¨¢metros: la diferencia de puntos Elo entre los dos equipos y el factor campo. Por ejemplo, cuando se enfrentan dos selecciones con una diferencia Elo de 100 puntos, el equipo favorito marca de media 1,5 goles y su rival 1. El modelo tambi¨¦n predice la probabilidad de una victoria (48%), de un empate (26%) y de cualquier resultado particular (un 2-1, por ejemplo, ocurre el 9% de las veces). Usamos una distribuci¨®n de tipo Poisson, que ajusta razonablemente bien los goles en f¨²tbol y se ha usado a menudo en modelos estad¨ªsticos y estudios acad¨¦micos.
Para calibrar este modelo hemos usado una base de datos de 17.000 partidos de selecciones. Con datos de entrenamiento, el modelo acierta el resultado del 62% de los partidos cuando hay un equipo local y el 54% en campo neutral. Evaluado en t¨¦rminos probabil¨ªsticos, las predicciones del modelo obtienen un score de 0,163 y 0,195 (expresado con un Ranking Probability Score, como se explica aqu¨ª o aqu¨ª). Una precisi¨®n razonable si la comparamos con otros modelos o con las apuestas deportivas.
?Por qu¨¦ usamos un modelo que predice goles y no victorias directamente? Porque tiene dos ventajas: resuelve la fase de grupos y sirve para predecir pr¨®rrogas. El tiempo extra puede modelarse (de forma simplista) como un partido de 30 minutos. Algunos estudios (desde Dixon & Coles, 1997) sugieren que los modelos que predicen goles infraestiman los empates que realmente se producen. Al analizar partidos de Champions y grandes ligas efectivamente hemos encontrado que ese sesgo existe: los equipos empatan m¨¢s de lo previsto. Pero ese efecto se reduce con partidos de selecciones. La diferencia parece razonable: en Liga y Champions el empate a menudo es ¨²til para el mejor equipo, pero ese no suele ser el caso en un mundial.
3. El simulador del torneo
El tercer elemento de la predicci¨®n es el simulador. El ¨²ltimo paso consiste en simular el torneo 10.000 veces, jugando virtualmente cada partido de la fase de grupos, de octavos, cuartos¡ y as¨ª hasta la final. Durante el torneo virtual se va actualizando un ranking Elo virtual. El modelo tiene en cuenta las reglas de la fase de grupos y el cuadro del mundial para ir creando los partidos sucesivos. Tambi¨¦n considera la posibilidad de empates, prorrogas y penaltis.
El resultado de las simulaciones son 10.000 versiones alternativas del torneo. As¨ª podemos calcular la probabilidad de cada equipo para pasar a cuartos o jugar la final. Pero tambi¨¦n situaciones muy particulares, como la probabilidad de que Espa?a juegue la final contra Alemania (6%) o que los cuatro semifinalistas sean Inglaterra, Alemania, Portugal y Espa?a (1%).
?Quieres ver las ¨²ltimas predicciones? Las puedes consultar en nuestra p¨¢gina web, que se va actualizando continuamente.
Preguntas frecuentes
?Entonces va a ganar Brasil??No, no. Nuestro modelo dice que Brasil es el favorito para ganar el mundial, s¨ª, pero tambi¨¦n que tiene solo una opci¨®n entre cinco de ganar. Es importante interpretar bien las probabilidades: Brasil es favorito, con un 17% de opciones, pero eso es poco m¨¢s probable que lanzar un dado y sacar un seis. La mayor¨ªa de las veces el ganador ser¨¢ otro equipo.
Estos datos vienen a demostrar que el mundial es una competici¨®n dif¨ªcil de predecir. No es una sorpresa. El mundial es un torneo igualado y dise?ado para que la suerte influya: no es una liga regular, no tiene playoffs, ni partidos de ida y vuelta. Adem¨¢s, hablamos de f¨²tbol, un deporte apasionante en gran medida porque est¨¢ lleno de sorpresas. Nadie se sentar¨ªa a ver un partido si el resultado estuviese decidido de antemano. Por eso los 100 metros no se disputan cada domingo, porque llevar¨ªamos a?os viendo ganar a Usain Bolt cada fin de semana.
?Existen otras predicciones para comparar??S¨ª, varias empresas, medios y grupos de investigaci¨®n han publicado (o publicar¨¢n) predicciones con modelos estad¨ªsticos. Por ejemplo, Opta Sports tiene un modelo que da favorito a Brasil (13%), seguido de Alemania (11%) y Argentina (10%). El banco UBS public¨® una predicci¨®n dando como favoritas a Alemania (24%), Brasil (20%) y Espa?a (16%). La otra fuente de pron¨®sticos son las apuestas. Los precios en los mercados de apostadores pueden traducirse en probabilidades. A fecha 30 de mayo, un promedio de 23 casas colocaba como favorita a Brasil (18%), seguida de Alemania (17%), Espa?a (13%) y Francia (12%)
?Deber¨ªa apostar usando vuestros pron¨®sticos??No, seguramente no. Nuestro modelo es relativamente sofisticado y creemos que puede funcionar bien. Pero las apuestas han demostrado en el pasado que son bastante precisas. Adem¨¢s, para no perder dinero no basta con batir sus pron¨®sticos, hay que compensar tambi¨¦n el margen que se reservan las casas al fijar los precios. Distintos modelos estad¨ªsticos se han medido contra las apuestas, y aunque algunos son igual o m¨¢s preciosos, en general no sirven para batir a las apuestas. Esto no es una sorpresa. Los modelos estad¨ªsticos son ¨²tiles como referencia, por transparencia y porque nos permiten calcular detalles que las apuestas no responden. Pero a la hora de acertar, las apuestas son dif¨ªciles de batir. Los expertos que fijan las cuotas pueden usar informaci¨®n extra para afinar sus pron¨®sticos ¡ªdetalles como estilos de juego, estados de forma o lesiones¡ª, pero tambi¨¦n, claro, sus propios modelos de predicci¨®n.
Tu suscripci¨®n se est¨¢ usando en otro dispositivo
?Quieres a?adir otro usuario a tu suscripci¨®n?
Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.
FlechaTu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.
En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.