?Qui¨¦n va a ganar la Copa Am¨¦rica? As¨ª est¨¢n las predicciones de nuestro modelo estad¨ªstico
Actualizamos las predicciones d¨ªa a d¨ªa con los resultados de la jornada
?Qu¨¦ opciones tiene cada equipo de ganar la Copa Am¨¦rica? Estamos enfrentando esa pregunta simulando el torneo miles de veces cada d¨ªa, conforme avanza. As¨ª podemos calcular qu¨¦ probabilidad tiene (y ten¨ªa) cada equipo de alcanzar la final o llevarse el torneo.
SELECCI?N |
---|
?NDICE EP | CUARTOS | SEMIFINALES | FINAL | GANA |
---|
En la tabla anterior puede consultar qu¨¦ equipos son favoritos y con qu¨¦ probabilidad. Tambi¨¦n es una buena muestra de la incertidumbre que encierra la pelota. El f¨²tbol es imprevisible, pero nuestro modelo lo tiene en cuenta: Argentina era la favorita para nuestro modelo al principio del torneo, pero el 66% de las veces el vencedor era otro.
Es la cuarta vez que publicamos predicciones de un torneo. Lo hicimos para los mundiales de 2018 y 2022 y lo tenemos en vivo ahora con la Eurocopa de Alemania. La metodolog¨ªa completa se puede leer al final, aunque la esencia del modelo es sencilla. Lo alimentamos con datos de resultados de cada selecci¨®n y de la calidad de sus jugadores, para luego simular el campeonato miles de veces.
C¨®mo han cambiado los favoritos
Cada d¨ªa actualizamos las predicciones y guardamos las anteriores. En el selector de la primera tabla se puede ver qu¨¦ dec¨ªa nuestro modelo cada d¨ªa. Adem¨¢s, en este otro gr¨¢fico mostramos la evoluci¨®n de nuestros pron¨®sticos a lo largo del torneo:
Las predicciones en la fase final
La tabla muestra los cruces jugados, y los m¨¢s probables, con las opciones de cada equipo de vencer en esos duelos si est¨¢n todav¨ªa por jugar.
Qu¨¦ dicen otras predicciones
?No somos los ¨²nicos haciendo pron¨®sticos! Cada a?o hay m¨¢s compa?¨ªas, comunidades y aficionados que se animan a hacer sus n¨²meros. En la tabla mostramos tres fuentes interesantes: el modelo estad¨ªstico de Opta, la empresa especializada en estad¨ªstica deportiva y la predicci¨®n de un promedio de casas de apuestas, que suelen ser las m¨¢s precisas.
SELECCI?N |
---|
EL PA?S | APUESTAS | OPTA |
---|
?C¨®mo funciona nuestro modelo?
Nuestras predicciones son el resultado de hacer miles de simulaciones. En cada partido, la probabilidad de que gane uno u otro equipo depende de sus estad¨ªsticas. Por ejemplo, si Argentina juega contra Bolivia, la probabilidad de que gane el primero ronda el 84%.
El modelo tiene tres partes:
1. M¨¦trica de fortaleza del equipo. Para medir esto usamos dos m¨¦tricas: sus resultados recientes (medidos con un r¨¢nking Elo) y la calidad de sus jugadores (medida con su valor en euros, con datos de la web Transfermarkt).
2. Simulador de partidos. Hemos entrenado un modelo con miles de encuentros para, dados dos equipos y sus m¨¦tricas de fortaleza, estimar c¨®mo de probable es cada resultado. El modelo dice la probabilidad de victoria, empate y derrota; incluso la de cada marcador. Por ejemplo, en un duelo hipot¨¦tico entre Argentina y Bolivia, los resultados m¨¢s probables son 2-0 y 3-0 con un 14% cada uno.
3. Simulador de la Copa Am¨¦rica completa. Por ¨²ltimo, lo que hacemos es simular el torneo partido a partido. Esto lo repetimos miles de veces, para tener 200.000 torneos posibles, y as¨ª poder estimar la probabilidad de cada evento.
A continuaci¨®n, respondemos algunas preguntas habituales con el modelo. Luego, damos m¨¢s detalles de su funcionamiento.
Las preguntas frecuentes
Entonces, ?dec¨ªs que va a ganar Argentina? No, no. Nuestro modelo dice que Argentina es la selecci¨®n con m¨¢s probabilidades, pero tambi¨¦n que tiene solo una opci¨®n entre tres de ganar. Es importante interpretar bien esto: en realidad, su victoria es igual de probable que ver a Manu Ginobili encestar un triple.
Estos datos vienen a demostrar que una Copa Am¨¦rica es dif¨ªcil de predecir. Y no es una sorpresa. Primero, es un torneo dise?ado para que la suerte influya: no es una liga regular, no tiene playoffs, ni partidos de ida y vuelta. Segundo, las selecciones juegan pocos partidos importantes y su rendimiento es m¨¢s incierto que el de un club. Y tercero, hablamos de f¨²tbol, un deporte apasionante porque est¨¢ lleno de sorpresas. Casi nadie se sentar¨ªa a ver un partido si el resultado estuviese decidido.
?Hab¨¦is hecho esto antes? S¨ª. Usamos un modelo parecido en los mundiales de 2018 y 2022. Aqu¨ª pod¨¦is leer qu¨¦ tal funcion¨® uno y otro. El modelo se ha demostrado bien calibrado: los resultados a los que d¨¢bamos una probabilidad entre 0% y 15% ocurrieron el 4% de las veces, por ejemplo, y aquellos con probabilidad 85% o 100% ocurrieron el 94% de las veces. En 2018, lo hicimos mucho mejor que el azar, mejor que el ranking FIFA y que dos grandes bancos (UBS y Goldman Sachs), aunque gan¨® Francia, que solo era nuestra sexta favorita al empezar. En 2022, la final la jugaron dos de los tres equipos que ve¨ªamos mejores, y batimos incluso a las apuestas.
?Deber¨ªa apostar usando vuestros pron¨®sticos? No. Nuestro modelo es relativamente sofisticado y puede funcionar bien. Pero las apuestas han demostrado en el pasado que son muy dif¨ªciles de mejorar. Adem¨¢s, para no perder dinero no basta con batirlas, tambi¨¦n hay que compensar el margen que se reservan las casas de apuestas al fijar los precios.
Los modelos estad¨ªsticos son ¨²tiles como referencia, por transparencia y porque nos permiten calcular detalles que las apuestas no responden. Pero, a la hora de acertar, las apuestas usan una aproximaci¨®n h¨ªbrida: combinan modelos propios con el ajuste fino que hacen sus expertos, para considerar la informaci¨®n extra que poseen (como detalles de estilos de juego, estados de forma o lesiones).
M¨¢s detalles t¨¦cnicos
Qu¨¦ es un ranking Elo. Es una m¨¦trica que captura la fuerza de cada equipo seg¨²n sus resultados. Cada equipo tiene cierta cantidad de puntos ¡ªsus puntos Elo¡ª, y con cada partido se produce un intercambio. El ganador se lleva puntos del perdedor. Si la victoria es por sorpresa (porque se impone el equipo d¨¦bil) los equipos se intercambian m¨¢s puntos. Los rankings Elo funcionan bien y se usan cada vez m¨¢s, en deportes y en videojuegos, por ejemplo, para organizar partidas entre jugadores de nivel parecido. Nuestro modelo usa el ranking Elo de la web Eloratings.
Por qu¨¦ usamos el valor de las plantillas. Porque las selecciones juegan pocos partidos competitivos y eso dificulta medir su rendimiento antes de una gran cita. Una forma de a?adir informaci¨®n al modelo es usar el valor en el mercado de fichajes de los jugadores que las componen. Tomamos los datos de la popular web Transfermarkt, ajustados por la edad de los jugadores (los mayores de treinta se abaratan por tener menos a?os de carrera por delante).
C¨®mo funciona el simulador de partidos. Hemos ajustado un modelo sencillo que estima los goles que marcar¨¢ cada equipo en funci¨®n de: 1) si es mejor o peor que su rival por puntos Elo, 2) si es mejor por valor de plantillas, y 3) si juega como anfitri¨®n, fuera o en campo neutral. El modelo usa una distribuci¨®n de tipo Poisson, que aproxima razonablemente los goles, y que se ha usado en modelos estad¨ªsticos y estudios acad¨¦micos.
Al final, para nuestro modelo, para un partido en campo neutral, la probabilidad de que un equipo gane un partido depende de dos n¨²meros: las diferencias con el rival en puntos Elo y valor de plantillas. El gr¨¢fico lo resume:
Un resumen del modelo. El gr¨¢fico muestra la probabilidad que tiene un equipo de ganar un partido en funci¨®n de dos par¨¢metros: las diferencia sobre su rival en puntos Elo y en valor econ¨®mico de sus plantillas.
Un equipo con una plantilla 160 millones m¨¢s cara que su rival y con 200 puntos m¨¢s de Elo gana el 62% de sus duelos
80%
Diferencia de
valor de
160 millones
80 millones
60
0
-80 millones
-160 millones
40
20
0
−200
0
200
Diferencia de ELO
Un resumen del modelo. El gr¨¢fico muestra la probabilidad que tiene un equipo de ganar un partido en funci¨®n de dos par¨¢metros: las diferencia sobre su rival en puntos Elo y en valor econ¨®mico de sus plantillas.
Un equipo con una plantilla 160 millones m¨¢s cara que su rival y con 200 puntos m¨¢s de Elo gana el 62% de sus duelos
80%
Diferencia de
valor de
160 millones
80 millones
60
0
-80 millones
-160 millones
40
20
0
−200
0
200
Diferencia de ELO
Un resumen del modelo. El gr¨¢fico muestra la probabilidad que tiene un equipo de ganar un partido en funci¨®n de dos par¨¢metros: las diferencia sobre su rival en puntos Elo y en valor econ¨®mico de sus plantillas.
Un equipo con una plantilla 160 millones m¨¢s cara que su rival y con 200 puntos m¨¢s de Elo gana el 62% de sus duelos
80%
Diferencia de valor de
160 millones
80 millones
60
0
-80 millones
-160 millones
40
20
0
−200
0
200
Diferencia de ELO
En la Copa Am¨¦rica, todos los partidos se consideran neutrales salvo los que juega Estados Unidos, la anfitriona. Los estadounidenses tienen un doble beneficio: les damos la ventaja que tiene un equipo cuando juega en casa ¡ªen un partido de liga o de clasificaci¨®n para un mundial, por ejemplo¡ª, pero adem¨¢s le sumamos un empuje extra equivalente a 0,2 goles por partido. Hemos elegido ese n¨²mero tomando como referencia un an¨¢lisis de FiveThirtyEight, que ha estimado la ventaja hist¨®rica del organizador en un Mundial en 0,4 goles por partido sobre lo esperado.
?Por qu¨¦ usamos un modelo que predice goles y no directamente victorias? Tiene dos ventajas hacerlo as¨ª: nos sirve para resolver la fase de grupos y para predecir pr¨®rrogas (como partidos de 30 minutos). Algunos estudios Dixon & Coles, 1997 dicen que los modelos que predicen goles infraestiman los empates. Hemos comprobado que es as¨ª en la Champions, y en las grandes ligas europeas, pero el efecto es menor en los Mundiales, y hemos decidido no hacer ese ajuste con la Copa Am¨¦rica.
Qu¨¦ acierto podemos esperar del modelo. Para calibrarlo, hemos usado una base de datos de 18.000 partidos de selecciones desde 2004, incluidos cientos de encuentros de Mundiales, Eurocopas y Copas Am¨¦rica.
Con datos de entrenamiento, el modelo acierta el resultado del 60% de los partidos con equipo local y el 56% en campo neutral. Evaluado en t¨¦rminos probabil¨ªsticos, las predicciones del modelo obtienen una puntuaci¨®n de entre 0,176 y 0,186 (expresado con un Ranking Probability Score, como se explica aqu¨ª o aqu¨ª. Una precisi¨®n razonable, si la comparamos con otros modelos o con las apuestas.
Entrenamiento del modelo. Los puntos representan los resultados de partidos reales y las l¨ªneas las predicciones del modelo. Para partidos entre equipos con cierta diferencia de 'ranking' Elo (eje x), se muestra la probabilidad o el porcentaje que acaban en derrota, empate o victoria (eje y).
Derrotas
(prob. en %)
Empates
(prob. en %)
Victorias
(prob. en %)
75%
50
Realidad
25
Modelo
0
−200
0
200
−200
0
200
−200
0
200
Diferencia de ELO
Entrenamiento del modelo. Los puntos representan los resultados de partidos reales y las l¨ªneas las predicciones del modelo. Para partidos entre equipos con cierta diferencia de ranking Elo (eje x), se muestra la probabilidad o el porcentaje que acaban en derrota, empate o victoria (eje y).
Derrotas
(prob. en %)
Empates
(prob. en %)
Victorias
(prob. en %)
75%
50
Realidad
25
Modelo
0
−200
0
200
−200
0
200
−200
0
200
Diferencia de ELO
Entrenamiento del modelo. Los puntos representan los resultados de partidos reales y las l¨ªneas las predicciones del modelo. Para partidos entre equipos con cierta diferencia de ranking Elo (eje x), se muestra la probabilidad o el porcentaje que acaban en derrota, empate o victoria (eje y).
Derrotas
(prob. en %)
Empates
(prob. en %)
Victorias
(prob. en %)
75%
50
Realidad
25
Modelo
0
−200
0
200
−200
0
200
−200
0
200
Diferencia de ELO
Tambi¨¦n pod¨¦is ver la evaluaci¨®n que hicimos de nuestro modelo de 2018 y en 2022, tras cada mundial.
Puedes seguir a EL PA?S Deportes en Facebook y X, o apuntarte aqu¨ª para recibir nuestra newsletter semanal.