?Qu¨¦ selecci¨®n ganar¨¢ el Mundial? As¨ª funcionan nuestras predicciones
Consulte la metodolog¨ªa del modelo estad¨ªstico de EL PA?S. Respondemos dudas habituales y frenamos las expectativas sobre su exactitud
Queremos responder a una pregunta dif¨ªcil y divertida: ?Qu¨¦ opciones de ganar el Mundial tiene cada selecci¨®n? Para hacerlo simulamos el torneo decenas de miles de veces. As¨ª podemos calcular qu¨¦ probabilidad tiene cada equipo de llegar a octavos, jugar las semifinales o llevarse el torneo.
Esta es nuestra predicci¨®n de partida:
SELECCI?N |
---|
?NDICE EP | OCTAVOS | CUARTOS | SEMIFINALES | FINAL | GANA |
---|
Estos datos nos dicen qu¨¦ equipos son favoritos y en qu¨¦ medida lo son. Tambi¨¦n capturan una realidad: el Mundial es bastante imprevisible. Las personas esperamos que gane el favorito, pero los datos dicen que eso es raro: aunque Brasil tiene m¨¢s opciones de ganar que ning¨²n otro equipo, Brasil solo ganar¨¢ una de cada cuatro veces.
Las probabilidades se actualizar¨¢n cada d¨ªa, aqu¨ª en EL PA?S. A continuaci¨®n explicamos c¨®mo funciona el modelo, empezando con un juego¡
Simule su un Mundial
Haciendo clic en el bot¨®n de abajo puede simular un Mundial con el modelo, y ver qui¨¦n gana. Si vuelve a clicar, har¨¢ una segunda simulaci¨®n y seguramente ganar¨¢ otro. Sus ganadores se van acumulando en la tabla.
Si pasa un rato jugando con esto, ver¨¢ que los porcentajes de ganadores convergen a la tabla del principio. Lo har¨¢ despacio, porque as¨ª es el azar.
C¨®mo funciona el modelo
Nuestras predicciones son el resultado de hacer miles de simulaciones como las anteriores, que solo son azarosas en parte. En cada partido, la probabilidad de que gane uno u otro equipo depende de sus estad¨ªsticas. Por ejemplo, si Brasil juega contra Arabia Saud¨ª, la probabilidad de que gane el primero ronda el 87%.
El modelo tiene tres partes:
1. ?C¨®mo de fuerte es cada equipo? Para capturar esto usamos dos m¨¦tricas: sus resultados recientes (medidos con un r¨¢nking Elo, un m¨¦todo original del ajedrez y que ahora tambi¨¦n usa el ranking oficial de la FIFA) y la calidad de sus jugadores (medida con su valor en euros, con datos de la web Transfermarkt).
2. ?Qui¨¦n gana cada partido? Hemos entrenado un modelo con miles de encuentros para, dados dos equipos y sus m¨¦tricas de fortaleza, estimar c¨®mo de probable es cada resultado. El modelo dice la probabilidad de victoria, empate y derrota, e incluso la de cada marcador. Por ejemplo, en ese duelo hipot¨¦tico entre Brasil y Arabia Saud¨ª, los resultados m¨¢s probables son 2-0 y 3-0, con alrededor del 14% cada uno.
3. ?Y para predecir el Mundial completo? Lo que hacemos es simularlo partido a partido, cruce a cruce. Eso lo repetimos miles de veces, para tener 100.000 Mundiales posibles, y as¨ª poder estimar la probabilidad de cada evento. Si Brasil gana el torneo en 23.000 de 100.000 simulaciones, es porque tiene un 23% de probabilidades.
Sigue leyendo si quieres m¨¢s detalles. Si quieres ver las ¨²ltimas predicciones, las tendr¨¢s aqu¨ª cada d¨ªa.
Preguntas frecuentes
?Entonces dec¨ªs que va a ganar Brasil? No, no. Nuestro modelo dice que Brasil es la selecci¨®n con m¨¢s probabilidades, pero tambi¨¦n que tiene solo una opci¨®n entre cuatro de ganar. Es importante interpretar bien esto: en realidad, su victoria es tan poco probable como ver fallar un penalti.
Estos datos vienen a demostrar que un Mundial es dif¨ªcil de predecir. Y no es una sorpresa. Primero, es un torneo dise?ado para que la suerte influya: no es una liga regular, no tiene playoffs, ni partidos de ida y vuelta. Segundo, las selecciones juegan pocos partidos importantes y su rendimiento es m¨¢s incierto que el de un club. Y, tercero, estamos hablamos de f¨²tbol, un deporte apasionante porque est¨¢ lleno de sorpresas. Casi nadie se sentar¨ªa a ver un partido si el resultado estuviese decidido.
?Existen otras predicciones? S¨ª. En la tabla siguiente mostramos otras tres que nos parecen interesantes: el modelo estad¨ªstico de The Analyst, las cuotas de una treintena de casas de apuestas y los pron¨®sticos de la comunidad de pronosticadores Metaculus.
SELECCI?N |
---|
EL PA?S | APUESTAS | METACULUS | OPTA |
---|
?Hab¨¦is hecho esto antes? S¨ª. Usamos un modelo parecido en el Mundial de 2018. Aqu¨ª pod¨¦is leer qu¨¦ tal funcion¨®. El modelo se demostr¨® bien calibrado: los resultados a los que d¨¢bamos una probabilidad entre 0% y 10% ocurrieron el 3% de las veces, por ejemplo, y aquellos con probabilidad 90% o 100% ocurrieron siempre. Lo hicimos mucho mejor que el azar, mejor que el ranking FIFA y que dos grandes bancos (UBS y Goldman Sachs). No batimos a las apuestas, y hay que decir que el Mundial lo gan¨® Francia, que solo era nuestra sexta favorita al empezar.
?Deber¨ªa apostar usando vuestros pron¨®sticos? No. Nuestro modelo es relativamente sofisticado y puede funcionar bien. Pero las apuestas han demostrado en el pasado que son muy dif¨ªciles de mejorar. Adem¨¢s, para no perder dinero no basta con batirlas, tambi¨¦n hay que compensar el margen que se reservan las casas de apuestas al fijar los precios.
Esto no es una sorpresa. Los modelos estad¨ªsticos son ¨²tiles como referencia, por transparencia y porque nos permiten calcular detalles que las apuestas no responden. Pero, a la hora de acertar, las apuestas usan una aproximaci¨®n h¨ªbrida: combinan modelos propios con el ajuste fino que hacen sus expertos, para considerar la informaci¨®n extra que poseen, como detalles de estilos de juego, estados de forma o lesiones.
M¨¢s detalles t¨¦cnicos
Qu¨¦ es un ranking Elo. Es una m¨¦trica que captura la fuerza de cada equipo seg¨²n sus resultados. Cada equipo tiene cierta cantidad de puntos ¡ªsus puntos Elo¡ª, y cuando se juega un partido se produce un intercambio. El ganador se lleva puntos del perdedor. Si la victoria es por sorpresa (porque se impone el equipo d¨¦bil) los equipos se intercambian m¨¢s puntos. Los rankings Elo funcionan bien y se usan cada vez m¨¢s, en deportes y en videojuegos, por ejemplo, para organizar partidas entre jugadores de nivel parecido. Nuestro modelo usa el ranking Elo de la web Eloratings.
Por qu¨¦ usamos el valor de las plantillas. Porque las selecciones juegan pocos partidos competitivos y eso dificulta medir su rendimiento antes de una gran cita. Una forma de a?adir informaci¨®n al modelo sobre la calidad de cada selecci¨®n es usar el valor en el mercado de fichajes de los jugadores que las componen. Tomamos los datos de la popular web Transfermarkt, ajustados por la edad de los jugadores (los mayores de treinta se abaratan por tener menos a?os de carrera por delante).
C¨®mo funciona el simulador de partidos. Hemos ajustado un modelo sencillo que estima los goles que marcar¨¢ cada equipo en funci¨®n de si es mejor o peor que su rival, en puntos Elo y valor de plantillas. El modelo tambi¨¦n tiene en cuenta si los partidos tienen un anfitri¨®n o se juegan en campo neutral, pero eso apenas influye en el mundial. Usamos una distribuci¨®n de tipo Poisson, que ajusta razonablemente los goles en f¨²tbol y que se ha usado en modelos estad¨ªsticos y estudios acad¨¦micos.
Al final, para nuestro modelo, la probabilidad de que un equipo gane un partido depende de n¨²meros: las diferencias con el rival en puntos Elo y en valor de plantillas. El gr¨¢fico lo resume con n¨²meros:
Un resumen del modelo. El gr¨¢fico muestra la probabilidad que tiene un equipo de ganar un partido en funci¨®n de dos par¨¢metros: las diferencia sobre su rival en puntos Elo y en valor econ¨®mico de sus plantillas.
Un equipo con una plantilla 160 millones m¨¢s cara que su rival y con 200 puntos m¨¢s de Elo gana el 62% de sus duelos
80%
Diferencia de
valor de
160 millones
80 millones
60
0
-80 millones
-160 millones
40
20
0
−200
0
200
Diferencia de ELO
Un resumen del modelo. El gr¨¢fico muestra la probabilidad que tiene un equipo de ganar un partido en funci¨®n de dos par¨¢metros: las diferencia sobre su rival en puntos Elo y en valor econ¨®mico de sus plantillas.
Un equipo con una plantilla 160 millones m¨¢s cara que su rival y con 200 puntos m¨¢s de Elo gana el 62% de sus duelos
80%
Diferencia de
valor de
160 millones
80 millones
60
0
-80 millones
-160 millones
40
20
0
−200
0
200
Diferencia de ELO
Un resumen del modelo. El gr¨¢fico muestra la probabilidad que tiene un equipo de ganar un partido en funci¨®n de dos par¨¢metros: las diferencia sobre su rival en puntos Elo y en valor econ¨®mico de sus plantillas.
Un equipo con una plantilla 160 millones m¨¢s cara que su rival y con 200 puntos m¨¢s de Elo gana el 62% de sus duelos
80%
Diferencia de valor de
160 millones
80 millones
60
0
-80 millones
-160 millones
40
20
0
−200
0
200
Diferencia de ELO
Qu¨¦ acierto podemos esperar del modelo. Para calibrarlo hemos usado una base de datos de 18.000 partidos de selecciones desde 2004, incluidos cientos de Mundiales y Eurocopas.
Con datos de entrenamiento, el modelo acierta el resultado del 60% de los partidos con equipo local y el 56% en campo neutral. Evaluado en t¨¦rminos probabil¨ªsticos, las predicciones del modelo obtienen una puntuaci¨®n de entre 0,176 y 0,186 (expresado con un Ranking Probability Score, como se explica aqu¨ª o aqu¨ª). Una precisi¨®n razonable, si la comparamos con otros modelos o con las apuestas deportivas.
Entrenamiento del modelo. Los puntos representan los resultados de partidos reales y las l¨ªneas las predicciones del modelo. Para partidos entre equipos con cierta diferencia de 'ranking' Elo (eje x), se muestra la probabilidad o el porcentaje que acaban en derrota, empate o victoria (eje y).
Derrotas
(prob. en %)
Empates
(prob. en %)
Victorias
(prob. en %)
75%
50
Realidad
25
Modelo
0
−200
0
200
−200
0
200
−200
0
200
Diferencia de ELO
Entrenamiento del modelo. Los puntos representan los resultados de partidos reales y las l¨ªneas las predicciones del modelo. Para partidos entre equipos con cierta diferencia de ranking Elo (eje x), se muestra la probabilidad o el porcentaje que acaban en derrota, empate o victoria (eje y).
Derrotas
(prob. en %)
Empates
(prob. en %)
Victorias
(prob. en %)
75%
50
Realidad
25
Modelo
0
−200
0
200
−200
0
200
−200
0
200
Diferencia de ELO
Entrenamiento del modelo. Los puntos representan los resultados de partidos reales y las l¨ªneas las predicciones del modelo. Para partidos entre equipos con cierta diferencia de ranking Elo (eje x), se muestra la probabilidad o el porcentaje que acaban en derrota, empate o victoria (eje y).
Derrotas
(prob. en %)
Empates
(prob. en %)
Victorias
(prob. en %)
75%
50
Realidad
25
Modelo
0
−200
0
200
−200
0
200
−200
0
200
Diferencia de ELO
Tambi¨¦n pod¨¦is poder la evaluaci¨®n que hicimos de nuestro modelo de 2018, despu¨¦s de acabar el mundial.
?Por qu¨¦ usamos un modelo que predice goles y no directamente victorias? Tiene dos ventajas hacerlo as¨ª: nos sirve para resolver la fase de grupos y para predecir pr¨®rrogas (como partidos de 30 minutos).
Algunos estudios (desde Dixon & Coles, 1997) dicen que los modelos que predicen goles infraestiman los empates que realmente se producen. Hemos comprobado que es as¨ª en la Champions y en las grandes ligas europeas, pero el efecto es menor en los Mundiales, y hemos decidido no hacer ajustes.
?Quieres ver las ¨²ltimas predicciones? Las puedes consultar actualizadas cada d¨ªa en la p¨¢gina web del modelo.