?Puede reducirse el f¨²tbol a n¨²meros? Cada vez hay m¨¢s gente intent¨¢ndolo
La revoluci¨®n que los datos llevaron al b¨¦isbol y al baloncesto lleg¨® con retraso al deporte m¨¢s popular. Pero es una realidad: los datos del f¨²tbol est¨¢n en ebullici¨®n
?Buenos d¨ªas! Aprovecho la Eurocopa para contaros c¨®mo las estad¨ªsticas est¨¢n cambiando el f¨²tbol. Es interesante si te gusta el juego, pero tambi¨¦n un reto anal¨ªtico: ?puedes iluminar con datos algo que ya est¨¢ mirando tanta gente?
- ?Te han enviado esto? Ap¨²ntate aqu¨ª ?
Los datos han supuesto una revoluci¨®n en muchos deportes, desde el b¨¦isbol al baloncesto. Es ya una rutina registrar los eventos del juego y tomar esa informaci¨®n para decidir t¨¢cticas, pulir jugadores o hacer fichajes. Esa transformaci¨®n ha llegado al f¨²tbol m¨¢s despacio, por sus caracter¨ªsticas o por su cultura menos cuantitativa, pero ahora mismo es una realidad: los datos del f¨²tbol est¨¢n en ebullici¨®n.
El primer paso lo dan empresas como Opta o Statsbomb, que est¨¢n midiendo miles de acciones de cada partido: pases, carreras, remates. Este lunes, por ejemplo, el checo Patrik Schick marc¨® un gol desde 45 metros ¡ªeste gol¡ª, y a los cinco minutos sab¨ªamos que desde 2014 se han hecho 1.554 disparos similares en grandes ligas y que se han marcado 30. Alrededor de estos datos ha surgido una comunidad. Empresas como las espa?olas Driblab y Olocip, que producen estad¨ªsticas avanzadas, hacen predicciones y ofrecen consejos a clubes y agentes. Tambi¨¦n hay periodistas haciendo anal¨ªtica, especialistas, aficionados y grupos de investigaci¨®n.
Son todos pioneros, que es para m¨ª lo m¨¢s interesante: est¨¢n aprendiendo a capturar con n¨²meros un juego sutil. ?Qu¨¦ hace bueno a Cristiano Ronaldo o Kevin de Bruyne? Es tentador pensar que son cosas intangibles, pero eso es perezoso. Codificando en detalle sus acciones sobre el campo, sus pases, sus movimiento, sus posiciones, acabaremos por averiguar lo que hacen. Siempre habr¨¢ destellos que se perder¨¢n, pero estos analistas quieren reducirlos al m¨ªnimo.
Lo que estamos viendo es el C¨¢mbrico de las estad¨ªsticas en f¨²tbol, la era para probar ideas. Estas son algunas de las m¨¦tricas m¨¢s populares.
El valor de tus remates: goles esperados. Fue la primera m¨¦trica de ¨¦xito, los xG, que consiste en asignar a cada disparo una probabilidad de acabar en gol, para capturar as¨ª su valor, seg¨²n la distancia, el ¨¢ngulo o el n¨²mero de defensas entre el bal¨®n y la porter¨ªa. En este ejemplo, con datos de Driblab, pod¨¦is ver los xG de Espa?a contra Suecia, en su partido del lunes pasado.
- El encuentro qued¨® 0-0, pero analizar goles esperados a?ade mucha informaci¨®n. Por ejemplo, si juzgamos los disparos, el resultado "esperado" del partido fue un 1,6-0,9, es decir, que Espa?a domin¨® aunque sin llegar a aplastar. Tambi¨¦n es preocupante que Suecia se mereciese un gol, aunque solo hizo cuatro remates y se pas¨® el 85% del tiempo persiguiendo el bal¨®n en posesi¨®n de Espa?a.
Por supuesto, esta m¨¦trica de goles esperados se pierde muchas cosas importantes (al fin y al cabo, solo mide remates). Pero eso tiene soluci¨®n: a?adir m¨¢s m¨¦tricas. El arsenal de estos analistas es una lista que no para de crecer: cifras de asistencias esperadas (los goles que deber¨ªan marcar tus compa?eros con tus pases), de construcci¨®n (el xG de las cadenas en las que participas), de progresi¨®n (los metros que avanzas el bal¨®n), de esfuerzos en presi¨®n, etc¨¦tera. En el partido de Espa?a, por ejemplo, Marcos Llorente y Pedri fueron los mejores en construcci¨®n; Koke y Jordi Alba, los mejores en creaci¨®n de peligro y ?lvaro Morata quien m¨¢s presion¨®.
Llevar el bal¨®n a zonas de m¨¢s peligro. Dos de las m¨¦tricas de moda son los modelos de peligro esperado (xT) y de valor por acci¨®n (VAEP). En ambos casos, la idea es asignar un valor a cada posici¨®n del juego: tener la posesi¨®n all¨ª se asocia con cierta probabilidad de lograr gol. Sabiendo eso, puedes calcular el valor que a?ade cada jugador con una acci¨®n: imagina que Koke arranco una jugada con valor 0,1 y la dejo en 0,3, gracias a una conducci¨®n y un pase fant¨¢stico; habr¨¢ creado 0,2 xT de peligro. Esta estad¨ªstica sirve para premiar acciones de un jugador que aumentan la probabilidad de marcar m¨¢s adelante, aunque no sea asistencias de gol, sino un pase antecesor. Este art¨ªculo ilustra muy bien la idea.
Para ver otro ejemplo, en la tabla muestro las estad¨ªsticas de disparos (xG) y creaci¨®n de peligro (xT) de cada jugador en lo que llevamos de Eurocopa.
- Son cifras de uno o dos partidos, pero interesantes. Es curioso ver la producci¨®n de Yarmolenko con Ucrania, o los buenos n¨²meros de Ronaldo en el primer partido de Portugal. Tambi¨¦n us¨¦ estos datos para repasar el Espa?a contra Suecia.
Estas m¨¦tricas capturan cada vez m¨¢s elementos del juego, pero los expertos saben que no son perfectas. Todav¨ªa se dejan cosas fuera. Es dif¨ªcil capturar el valor a?adido de un pase entre l¨ªneas, por ejemplo, porque eso exige saber d¨®nde est¨¢ cada defensa en cada momento. Tambi¨¦n cuesta juzgar a los defensas que se posicionan bien, porque anulan a sus rivales sin hacer una entrada ni una intercepci¨®n que quede registrada en datos. Sin embargo, esos vacios se conocen y ya se buscan formas de poder medirlos.
Por ¨²ltimo, me interesa pensar en descubrimientos.
Lo que est¨¢ haciendo la gente de anal¨ªtica es descifrar el juego. Esa es la tarea de Salvador Carmona y Cor¨¦ Ramiro, de Esteban Granero y su equipo, de los analistas de Leuven y de un largo etc¨¦tera. Andan recogiendo las piezas de un puzle: ?qu¨¦ hace excepcional a un jugador o un equipo? Muchas respuestas ser¨¢n aburridas, porque coincidir¨¢n con intuiciones y con el conocimiento que ya tiene el mundo del f¨²tbol, pero tambi¨¦n habr¨¢ hallazgos genuinos. Se descubrir¨¢n virtudes que hasta ahora no recib¨ªan la atenci¨®n merecida, como ha pasado con los triples en baloncesto. Me fascina pensar en un futbolista que repite una jugada, por casualidad o por instinto, que es m¨¢s valiosa de lo que cree todo el mundo, incluido ¨¦l mismo.
2. ?? Los datos de la Eurocopa
Este boom de las estad¨ªsticas en el f¨²tbol explica que en EL PA?S hayamos hecho un peque?o despliegue para la Eurocopa. Hemos preparados dos p¨¢ginas con las estad¨ªsticas avanzadas de equipos y jugadores:
?C¨®mo de bueno es cada equipo de la Eurocopa? Preparamos una clasificaci¨®n de fortaleza para medir a cada selecci¨®n, teniendo en cuenta: (1) la puntuaci¨®n FIFA (que ahora usa un sistema de puntos Elo tomado del ajedrez), (2) el valor en euros de sus jugadores, (3) la calidad de sus clubes, y (4) sus estad¨ªsticas durante el a?o.
- Francia es el mejor equipo de nuestra lista. Es el segundo para la FIFA y el segundo por los 1030 millones que valen sus jugadores, pero las apuestan coinciden con nosotros y lo colocan como el ganador m¨¢s probable, con un 16% de opciones para vencer. (Nota: no confundir ganador-m¨¢s-probable con ganador-probable, porque Francia pierde seis de cada siete veces.)
- Espa?a es la cuarta mejor selecci¨®n seg¨²n nuestros n¨²meros. Las apuestas la colocan quinta en opciones (9%), junto Alemania (10%), Portugal (9%) e Italia (9%).
En el art¨ªculo tambi¨¦n mostramos las estad¨ªsticas que ha logrado cada equipo en sus partidos oficiales desde 2018. Son datos muy finos que nos ha cedido Driblab, la empresa especializada en fichajes de la que os habl¨¦ antes, y que tiene datos minuciosos de decenas de ligas.
Compara los datos de 500 jugadores de la Eurocopa. Al texto sobre equipos le acompa?a un comparador con 500 jugadores, con las estad¨ªsticas que han logrado en sus clubes esta temporada. Usamos 16 m¨¦tricas avanzadas, de nuevo de Driblab, con datos de goles esperados, construcci¨®n, amenaza, etc¨¦tera. El tipo de datos de los que os habl¨¦ al principio. En el gr¨¢fico siguiente pod¨¦is comparar a Mbapp¨¦ y a Morata, por ejemplo.
Los dos art¨ªculos tienen muchos m¨¢s detalles. Si te interesa (un poco) el f¨²tbol o (un poco) las estad¨ªsticas, los tienes aqu¨ª y aqu¨ª.
3. ? ?C¨®mo es ser joven en 2021?
En EL PA?S hemos dedicado un especial al tema, con reportajes, entrevistas y un podcast. Los datos los hemos puesto Borja Andrino y yo, de momento en dos art¨ªculos y una docena de gr¨¢ficos.
1. Espa?a deja atr¨¢s a sus j¨®venes. Viven en un pa¨ªs mejor que hace 30 o 40 a?os, pero se enfrentan a problemas que se arrastran: sufren un paro enorme, un tercio est¨¢ riesgo de pobreza y dos tercios viven con sus padres.
- Los j¨®venes son ahora un colectivo en riesgo de pobreza o exclusi¨®n. Especialmente algunos: el riesgo es triple para quienes no acabaron el instituto (frente a universitarios); y doble para los inmigrantes (frente a los nacidos en Espa?a). Hasta la crisis de 2010 el grupo con m¨¢s vulnerables eran los mayores, pero ya no es as¨ª.
- Otro dato tremendo: el 64% de los j¨®venes viven con sus padres a los 25-29 a?os. Solo tienen cifras peores Italia, Grecia y algunos pa¨ªses balc¨¢nicos. Los n¨®rdicos son otro mundo (5%), pero tambi¨¦n Francia (17%) o Alemania (30%).
- ?ltima idea: los j¨®venes se han quedado atr¨¢s mientras el pa¨ªs avanzaba, porque el progreso desde los ochenta se ve en multitud de datos (vivimos m¨¢s, somos m¨¢s ricos, m¨¢s libres).
2. Los n¨²meros del cr¨¢ter laboral de los j¨®venes en Espa?a. Muy pocos j¨®venes trabajan en comparaci¨®n con Europa, y tenemos r¨¦cord de trabajadores pobres y de contratos que no duran ni semanas.
- Solo el 20% de los j¨®venes de 15-24 a?os tienen un empleo de alg¨²n tipo, frente al 31% de la UE y lejos de pa¨ªses ricos como Suecia (39%), Alemania (48%) o el Reino Unido (51%).
- Esa falta de trabajo contin¨²a a los 25-29 a?os, tengan o no estudios. Apenas el 59% de espa?oles con estudios medios est¨¢n trabajando, frente al 72% de la UE. Y solo dos pa¨ªses tienen peores cifras que Espa?a para sus universitarios (70%).
- Espa?a tiene r¨¦cords de ultratemporalidad. Los contratos de menos de tres meses son m¨¢s frecuentes que en casi cualquier pa¨ªs. Incluso entre universitarios, el 7% de los cuales tienen un empleo de semanas, el doble que en la UE.
Al hablar de generaciones se abusan de discursos hiperb¨®licos. Desde un extremo, se exagera cualquier problema al que te enfrentas de joven, aunque sean dificultades que tuvo mucha gente antes que t¨². En el otro, se niegan problemas evidentes que afectan a adultos de 21 o 29 a?os, algunos arrastrados desde hace d¨¦cadas. Mirar datos ayuda a equilibrar.
4. Otras dos historias random
¡ ? El valor de darte a conocer. Un problema con una compa?¨ªa en la nube, Fastly, provoc¨® la semana pasada que se cayeran varias webs durante una hora (Amazon, Twitch, The New York Times o EL PA?S funcionaron mal). Era una empresa que casi nadie conoce, aunque se encarga de acelerar muchas webs que usamos. Pero era invisible. Eso explica lo que pas¨® el d¨ªa del fallo: ?ese d¨ªa sus acciones subieron de valor en lugar de bajar! Pasaron de 50 d¨®lares y los 57 que val¨ªan este lunes (aunque ahora andan en 54). Es una paradoja comprensible: aunque las noticias de aquella jornada no fueron buenas para la empresas, acaparar tanta atenci¨®n le sirvi¨® para que muchos inversores descubriesen que existe y tiene clientes como Amazon y varios gobiernos.
¡? El periodista Ed Yong gana el Pulitzer. Yong ha escrito para The Atlantic algunos de los mejores art¨ªculos sobre la covid. El jurado lo premia por ¡°anticipar el curso de la enfermedad, sintetizar los retos complejos que enfrent¨® el pa¨ªs [EEUU], por iluminar los fallos del Gobierno, y por proporcionar contexto claro y accesible del reto cient¨ªfico y humano que supon¨ªa¡±. Su trabajo es brillant¨ªsimo. Pero el galard¨®n de Yong me alegra tambi¨¦n porque premia unas textos de formato arriesgado en periodismo: es un periodistas riguroso con decenas de fuentes, pero que tambi¨¦n se atreve a emitir juicio y sacar conclusiones.
?Nos ayudas? Reenv¨ªa esta newsletter a tus contactos o diles que se apunten aqu¨ª. Puedes escribirme con ideas, comentarios o pistas a mi correo (kllaneras@elpais.es) o por Twitter (@kikollan).
Tu suscripci¨®n se est¨¢ usando en otro dispositivo
?Quieres a?adir otro usuario a tu suscripci¨®n?
Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.
FlechaTu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.
En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.
Sobre la firma
Archivado En
- Eurocopa 2020
- Eurocopa
- Periodismo de datos
- Coronavirus Covid-19
- J¨®venes
- Desempleo
- Campeonato Europa
- Pandemia
- Coronavirus
- Juventud
- Periodismo
- Epidemia
- Enfermedades infecciosas
- Empleo
- F¨²tbol
- Enfermedades
- Competiciones
- Medicina
- Deportes
- Trabajo
- Medios comunicaci¨®n
- Biolog¨ªa
- Salud
- Comunicaci¨®n
- Ciencia
- Newsletter Kiko Llaneras