?Qui¨¦n va a ganar la Eurocopa? As¨ª est¨¢n las predicciones de nuestro modelo estad¨ªstico
Consulte las probabilidades de cada selecci¨®n para ganar el torneo
?Qu¨¦ opciones tiene cada selecci¨®n de ganar la Eurocopa? Estamos enfrentando esa pregunta simulando el torneo miles de veces cada d¨ªa, conforme avanza. As¨ª podemos calcular qu¨¦ probabilidad tiene (y ten¨ªa) cada equipo de alcanzar cada fase o llevarse el torneo.
SELECCI?N |
---|
?NDICE EP | OCTAVOS | CUARTOS | SEMIFINALES | FINAL | GANA |
---|
La tabla anterior dice qu¨¦ equipos son favoritos y en qu¨¦ medida. Los datos tambi¨¦n demuestran la enorme incertidumbre del terreno de juego. El f¨²tbol es un deporte imprevisible, pero nuestro modelo lo sabe: por eso, aunque Francia era la favorita al empezar la Eurocopa, el 80% de las veces acababa eliminada en las simulaciones del modelo (como efectivamente ocurri¨®).
Esta es la tercera vez que publicamos predicciones de un torneo, despu¨¦s de los mundiales de 2018 y 2022. La metodolog¨ªa completa se puede leer al final, aunque la esencia del modelo es sencilla. Lo alimentamos con datos de resultados de cada selecci¨®n y de la calidad de sus jugadores, para luego simular el campeonato miles de veces.
C¨®mo han cambiado los favoritos
Cada d¨ªa actualizamos las predicciones y guardamos las anteriores. En el selector de la primera tabla se puede ver qu¨¦ dec¨ªa nuestro modelo en cada momento. Adem¨¢s, en este otro gr¨¢fico mostramos la evoluci¨®n de nuestros pron¨®sticos a lo largo del torneo:
Las predicciones durante la fase final
La tabla muestra los cruces jugados, y los m¨¢s probables, con las opciones de cada equipo de vencer en esos duelos si est¨¢n todav¨ªa por jugar.
Qu¨¦ dicen otras predicciones
?No somos los ¨²nicos haciendo pron¨®sticos! Cada a?o hay m¨¢s compa?¨ªas, comunidades y aficionados que se animan a hacer sus n¨²meros. En la tabla mostramos tres fuentes interesantes: el modelo estad¨ªstico de Opta, la empresa especializada en estad¨ªstica deportiva, la predicci¨®n de un promedio de casas de apuestas, que suelen ser lo m¨¢s preciso, y por ¨²ltimo, la predicci¨®n de Metaculus, una comunidad de pronosticadores.
SELECCI?N |
---|
EL PA?S | APUESTAS | METACULUS | OPTA |
---|
?C¨®mo funciona nuestro modelo?
Nuestras predicciones son el resultado de hacer miles de simulaciones. En cada partido, la probabilidad de que gane uno u otro equipo depende de sus estad¨ªsticas. Por ejemplo, si Francia juega contra Albania, la probabilidad de que gane el primero ronda el 83%.
El modelo tiene tres partes:
1. M¨¦trica de fortaleza del equipo. Para medir esto usamos dos m¨¦tricas: sus resultados recientes (medidos con un r¨¢nking Elo) y la calidad de sus jugadores (medida con su valor en euros, con datos de la web Transfermarkt).
2. Simulador de partidos. Hemos entrenado un modelo con miles de encuentros para, dados dos equipos y sus m¨¦tricas de fortaleza, estimar c¨®mo de probable es cada resultado. El modelo dice la probabilidad de victoria, empate y derrota; incluso la de cada marcador. Por ejemplo, en un duelo hipot¨¦tico entre Francia y Albania, los resultados m¨¢s probables son 2-0 y 3-0 con un 14% cada uno.
3. Simulador de la Eurocopa completa. Por ¨²ltimo, lo que hacemos es simular el torneo partido a partido. Esto lo repetimos miles de veces, para tener 200.000 eurocopas posibles, y as¨ª poder estimar la probabilidad de cada evento.
A continuaci¨®n respondemos algunas preguntas habituales con el modelo. Luego, damos m¨¢s detalles de su funcionamiento.
Las preguntas frecuentes
Entonces, ?dec¨ªs que va a ganar Francia? No, no. Nuestro modelo dice que Francia es la selecci¨®n con m¨¢s probabilidades, pero tambi¨¦n que tiene solo una opci¨®n entre cinco de ganar. Es importante interpretar bien esto: en realidad, su victoria es tan poco probable como ver fallar un tiro libre.
Estos datos vienen a demostrar que una Eurocopa es dif¨ªcil de predecir. Y no es una sorpresa. Primero, es un torneo dise?ado para que la suerte influya: no es una liga regular, no tiene playoffs, ni partidos de ida y vuelta. Segundo, las selecciones juegan pocos partidos importantes y su rendimiento es m¨¢s incierto que el de un club. Y tercero, hablamos de f¨²tbol, un deporte apasionante porque est¨¢ lleno de sorpresas. Casi nadie se sentar¨ªa a ver un partido si el resultado estuviese decidido.
?Hab¨¦is hecho esto antes? S¨ª. Usamos un modelo parecido en los mundiales de 2018 y 2022. Aqu¨ª pod¨¦is leer qu¨¦ tal funcion¨® uno y otro. El modelo se ha demostrado bien calibrado: los resultados a los que d¨¢bamos una probabilidad entre 0% y 15% ocurrieron el 4% de las veces, por ejemplo, y aquellos con probabilidad 85% o 100% ocurrieron el 94% de las veces. En 2018, lo hicimos mucho mejor que el azar, mejor que el ranking FIFA y que dos grandes bancos (UBS y Goldman Sachs), aunque gan¨® Francia, que solo era nuestra sexta favorita al empezar. En 2022, la final la jugaron dos de los tres equipos que ve¨ªamos mejores, y batimos incluso a las apuestas.
?Deber¨ªa apostar usando vuestros pron¨®sticos? No. Nuestro modelo es relativamente sofisticado y puede funcionar bien. Pero las apuestas han demostrado en el pasado que son muy dif¨ªciles de mejorar. Adem¨¢s, para no perder dinero no basta con batirlas, tambi¨¦n hay que compensar el margen que se reservan las casas de apuestas al fijar los precios.
Los modelos estad¨ªsticos son ¨²tiles como referencia, por transparencia y porque nos permiten calcular detalles que las apuestas no responden. Pero, a la hora de acertar, las apuestas usan una aproximaci¨®n h¨ªbrida: combinan modelos propios con el ajuste fino que hacen sus expertos, para considerar la informaci¨®n extra que poseen (como detalles de estilos de juego, estados de forma o lesiones).
M¨¢s detalles t¨¦cnicos
Qu¨¦ es un ranking Elo. Es una m¨¦trica que captura la fuerza de cada equipo seg¨²n sus resultados. Cada equipo tiene cierta cantidad de puntos ¡ªsus puntos Elo¡ª, y con cada partido se produce un intercambio. El ganador se lleva puntos del perdedor. Si la victoria es por sorpresa (porque se impone el equipo d¨¦bil) los equipos se intercambian m¨¢s puntos. Los rankings Elo funcionan bien y se usan cada vez m¨¢s, en deportes y en videojuegos, por ejemplo, para organizar partidas entre jugadores de nivel parecido. Nuestro modelo usa el ranking Elo de la web Eloratings.
Por qu¨¦ usamos el valor de las plantillas. Porque las selecciones juegan pocos partidos competitivos y eso dificulta medir su rendimiento antes de una gran cita. Una forma de a?adir informaci¨®n al modelo es usar el valor en el mercado de fichajes de los jugadores que las componen. Tomamos los datos de la popular web Transfermarkt, ajustados por la edad de los jugadores (los mayores de treinta se abaratan por tener menos a?os de carrera por delante).
C¨®mo funciona el simulador de partidos. Hemos ajustado un modelo sencillo que estima los goles que marcar¨¢ cada equipo en funci¨®n de: 1) si es mejor o peor que su rival por puntos Elo, 2) si es mejor por valor de plantillas, y 3) si juega como anfitri¨®n, fuera o en campo neutral. El modelo usa una distribuci¨®n de tipo Poisson, que aproxima razonablemente los goles, y que se ha usado en modelos estad¨ªsticos y estudios acad¨¦micos.
Al final, para nuestro modelo, para un partido en campo neutral, la probabilidad de que un equipo gane un partido depende de dos n¨²meros: las diferencias con el rival en puntos Elo y valor de plantillas. El gr¨¢fico lo resume:
Un resumen del modelo. El gr¨¢fico muestra la probabilidad que tiene un equipo de ganar un partido en funci¨®n de dos par¨¢metros: las diferencia sobre su rival en puntos Elo y en valor econ¨®mico de sus plantillas.
Un equipo con una plantilla 160 millones m¨¢s cara que su rival y con 200 puntos m¨¢s de Elo gana el 62% de sus duelos
80%
Diferencia de
valor de
160 millones
80 millones
60
0
-80 millones
-160 millones
40
20
0
−200
0
200
Diferencia de ELO
Un resumen del modelo. El gr¨¢fico muestra la probabilidad que tiene un equipo de ganar un partido en funci¨®n de dos par¨¢metros: las diferencia sobre su rival en puntos Elo y en valor econ¨®mico de sus plantillas.
Un equipo con una plantilla 160 millones m¨¢s cara que su rival y con 200 puntos m¨¢s de Elo gana el 62% de sus duelos
80%
Diferencia de
valor de
160 millones
80 millones
60
0
-80 millones
-160 millones
40
20
0
−200
0
200
Diferencia de ELO
Un resumen del modelo. El gr¨¢fico muestra la probabilidad que tiene un equipo de ganar un partido en funci¨®n de dos par¨¢metros: las diferencia sobre su rival en puntos Elo y en valor econ¨®mico de sus plantillas.
Un equipo con una plantilla 160 millones m¨¢s cara que su rival y con 200 puntos m¨¢s de Elo gana el 62% de sus duelos
80%
Diferencia de valor de
160 millones
80 millones
60
0
-80 millones
-160 millones
40
20
0
−200
0
200
Diferencia de ELO
En la Eurocopa, todos los partidos se consideran neutrales salvo los que juega Alemania, la anfitriona. Los alemanes tienen un doble beneficio: les damos la ventaja que tiene un equipo cuando juega en casa ¡ªen un partido de liga o de clasificaci¨®n para un mundial, por ejemplo¡ª, pero adem¨¢s le sumamos un empuje extra equivalente a 0,2 goles por partido. Hemos elegido ese n¨²mero tomando como referencia un an¨¢lisis de FiveThirtyEight, que ha estimado la ventaja hist¨®rica del organizador en un Mundial en 0,4 goles por partido sobre lo esperado.
?Por qu¨¦ usamos un modelo que predice goles y no directamente victorias? Tiene dos ventajas hacerlo as¨ª: nos sirve para resolver la fase de grupos y para predecir pr¨®rrogas (como partidos de 30 minutos). Algunos estudios Dixon & Coles, 1997 dicen que los modelos que predicen goles infraestiman los empates. Hemos comprobado que es as¨ª en la Champions, y en las grandes ligas europeas, pero el efecto es menor en los Mundiales, y hemos decidido no hacer ese ajuste con la Eurocopa.
Qu¨¦ acierto podemos esperar del modelo. Para calibrarlo, hemos usado una base de datos de 18.000 partidos de selecciones desde 2004, incluidos cientos de encuentros de Mundiales y Eurocopas.
Con datos de entrenamiento, el modelo acierta el resultado del 60% de los partidos con equipo local y el 56% en campo neutral. Evaluado en t¨¦rminos probabil¨ªsticos, las predicciones del modelo obtienen una puntuaci¨®n de entre 0,176 y 0,186 (expresado con un Ranking Probability Score, como se explica aqu¨ª o aqu¨ª. Una precisi¨®n razonable, si la comparamos con otros modelos o con las apuestas.
Entrenamiento del modelo. Los puntos representan los resultados de partidos reales y las l¨ªneas las predicciones del modelo. Para partidos entre equipos con cierta diferencia de 'ranking' Elo (eje x), se muestra la probabilidad o el porcentaje que acaban en derrota, empate o victoria (eje y).
Derrotas
(prob. en %)
Empates
(prob. en %)
Victorias
(prob. en %)
75%
50
Realidad
25
Modelo
0
−200
0
200
−200
0
200
−200
0
200
Diferencia de ELO
Entrenamiento del modelo. Los puntos representan los resultados de partidos reales y las l¨ªneas las predicciones del modelo. Para partidos entre equipos con cierta diferencia de ranking Elo (eje x), se muestra la probabilidad o el porcentaje que acaban en derrota, empate o victoria (eje y).
Derrotas
(prob. en %)
Empates
(prob. en %)
Victorias
(prob. en %)
75%
50
Realidad
25
Modelo
0
−200
0
200
−200
0
200
−200
0
200
Diferencia de ELO
Entrenamiento del modelo. Los puntos representan los resultados de partidos reales y las l¨ªneas las predicciones del modelo. Para partidos entre equipos con cierta diferencia de ranking Elo (eje x), se muestra la probabilidad o el porcentaje que acaban en derrota, empate o victoria (eje y).
Derrotas
(prob. en %)
Empates
(prob. en %)
Victorias
(prob. en %)
75%
50
Realidad
25
Modelo
0
−200
0
200
−200
0
200
−200
0
200
Diferencia de ELO
Tambi¨¦n pod¨¦is ver la evaluaci¨®n que hicimos de nuestro modelo de 2018 y en 2022, tras cada mundial.
Puedes seguir a EL PA?S Deportes en Facebook y X, o apuntarte aqu¨ª para recibir nuestra newsletter semanal.