T¨®cala otra vez, algoritmo: as¨ª es la carrera por recomendarte la canci¨®n perfecta
Repasamos el origen, evoluci¨®n y retos pendientes de los sistemas de recomendaci¨®n musical de la mano de Sergio Oramas, investigador de Pandora
Los robots lo han vuelto a hacer. Han sustituido a tu amigo, el que sabe mucho de m¨²sica. O est¨¢n pr¨®ximos a hacerlo. El mercado de las recomendaciones musicales basadas en deep learning tiene cada vez m¨¢s punter¨ªa. De dar palos de ciego basados sencillamente en el g¨¦nero -¡°si te gusta Blur, te gustar¨¢ Oasis¡±-, hemos pasado a propuestas que se crean combinando tus gustos con los de la gente que es como t¨² y toman en consideraci¨®n variables como el ritmo, el timbre y las letras de ca...
Los robots lo han vuelto a hacer. Han sustituido a tu amigo, el que sabe mucho de m¨²sica. O est¨¢n pr¨®ximos a hacerlo. El mercado de las recomendaciones musicales basadas en deep learning tiene cada vez m¨¢s punter¨ªa. De dar palos de ciego basados sencillamente en el g¨¦nero -¡°si te gusta Blur, te gustar¨¢ Oasis¡±-, hemos pasado a propuestas que se crean combinando tus gustos con los de la gente que es como t¨² y toman en consideraci¨®n variables como el ritmo, el timbre y las letras de cada canci¨®n. ¡°Lo que mejor funciona es el historial de cosas escuchadas, los datos demogr¨¢ficos no son muy importantes salvo para usuarios nuevos que no hayan escuchado nada a¨²n¡±, a?ade Sergio Oramas, investigador de Pandora.
De acuerdo con el experto, Netflix puso la primera piedra del momento en que se encuentran ahora los sistemas de recomendaci¨®n cuando organiz¨® Netflix Prize: un premio de un mill¨®n de d¨®lares para el equipo de desarrolladores que lograse la mejor propuesta de una herramienta de este tipo, aplicada a la selecci¨®n de pel¨ªculas. ¡°Esa competici¨®n hizo que se desarrollaran las tecnolog¨ªas de los sistemas de recomendaci¨®n que usamos ahora mismo¡±, se?ala. La aproximaci¨®n actual es parecida a la que se empleaba antes, pero alcanza mucha m¨¢s profundidad.
Dime qu¨¦ escuchas
Los sistemas de recomendaci¨®n se alimentan de tus gustos. La idea b¨¢sica es que si a ti te gusta A, B y C, otro usuario con tus caracter¨ªsticas podr¨ªa tener las mismas preferencias. Y viceversa: si D, E y F est¨¢n entre los artistas favoritos de ese otro usuario, a ti tambi¨¦n podr¨ªan encajarte. Cuando este intercambio ocurre, por ejemplo, entre los 286 millones de usuarios activos que alcanz¨® Spotify en abril, las posibilidades se multiplican. ¡°Esa inteligencia colectiva es lo que mejor funciona cuando tienes muchos usuarios¡±, a?ade el investigador. En los sistemas modernos, esa informaci¨®n se estructura en una matriz en la que se cruzan canciones y usuarios, y se muestra el dato de cu¨¢nto interact¨²a cada persona con cada tema. ¡°Ese es el m¨¦todo que sigue siendo a d¨ªa de hoy el que se aplica en casi todo¡±.
Pero este punto de partida no implica que todas las plataformas sigan el mismo camino. ¡°Depende de los datos¡±, matiza Oramas. El feedback que se obtiene del usuario cambia en funci¨®n de las din¨¢micas de cada servicio. ¡°Spotify, por ejemplo, tiene muchas playlists que han generado los usuarios. Esos datos son muy ricos. Pandora lo que tiene son estaciones basadas en artistas o en g¨¦neros. T¨² eliges un artista y el sistema te empieza a recomendar. Entonces el usuario puede dar un thumbs up a lo que le gusta. Esa informaci¨®n agregada a trav¨¦s de estaciones es muy potente¡±.
Dime qui¨¦n eres
?Y si no hay datos? Partir de cero no es una opci¨®n. Cuando el sistema de recomendaci¨®n se enfrenta a un nuevo usuario o una nueva canci¨®n, la ausencia de historiales que puedan compararse se suple, en el caso de las personas, con datos demogr¨¢ficos; y en el caso de las piezas musicales, con datos asociados a estas: letras, informaci¨®n sobre los artistas, g¨¦nero, ritmos, frecuencias, armon¨ªa... En este an¨¢lisis, son clave los avances del aprendizaje autom¨¢tico. ¡°Si intentabas recomendar utilizando el audio antes del deep learning, funcionaba muy mal¡±, asegura el investigador. Antes esas variables se estudiaban por separado. Ahora existe la posibilidad de entrenar al algoritmo para que encuentre patrones de todas ellas en millones de canciones. ¡°Eso que queda aprendido ah¨ª, que es un poco como una caja negra, funciona bastante mejor¡±.
Estas recomendaciones medio ciegas tambi¨¦n son ¨²tiles para cumplir las expectativas de usuarios que quieren salir de la burbuja y buscar sonidos nuevos en lugar de escuchar m¨¢s de lo mismo, que adem¨¢s es lo m¨¢s popular. ¡°El sistema mejora en el sentido de que puedes recomendar m¨¢s cat¨¢logo y hacer m¨¢s discovery¡±, explica el experto. ¡°Pero al grueso de los usuarios, que lo que le gusta son cosas que ya se han escuchado bastante en la plataforma. Con saber lo que gusta vas sobrado para la mayor¨ªa de las recomendaciones¡±.
Otra cosa es que estas necesidades satisfechas coincidan con las de la industria musical y, sobre todo, con las de los reci¨¦n llegados a ella. ¡°Si solo te basas en los usuarios, al final nunca vas a introducir artistas nuevos en la rueda. Hay millones de artistas underground que tienen su p¨²blico potencial que les podr¨ªa seguir pero no han encontrado la conexi¨®n todav¨ªa¡±, comenta Oramas.
Temazos o rarezas
Para las plataformas, explica el investigador, esto se presenta como una dicotom¨ªa entre explotar (exploit) y explorar (explore). Bajo el primer paradigma se recomienda lo m¨¢s popular, pues es garant¨ªa de ¨¦xito. ¡°Hay much¨ªsimos usuarios que est¨¢n contentos con eso, pero al final a la imagen de tu marca tambi¨¦n viene bien que se descubra m¨²sica. Aunque estos sean menos usuarios, a lo mejor hacen m¨¢s ruido, son trendsetters¡±. Exploit es tu amigo fiestero recomend¨¢ndote los temas que lo est¨¢n petando porque seguro que te van a gustar. Explore es el amigo mel¨®mano que te pasa canciones que nunca has escuchado.
Lo importante es que el algoritmo ya est¨¢ casi al nivel de una persona que te conoce. ¡°El sistema de recomendaci¨®n ha mejorado mucho en los ¨²ltimos a?os. Pero ese componente humano del amigo que sabe mucho de m¨²sica no lo puedes sustituir del todo. Todav¨ªa queda camino para mejorar¡±, afirma el investigador. Uno de los retos est¨¢n en llegar a recomendar m¨²sica de todo el cat¨¢logo, sobre la base de una profunda comprensi¨®n de las preferencias del usuario, el artista y su m¨²sica. ¡°As¨ª podr¨ªamos realmente conectarlos a todos¡±.
Otro gran objetivo es meter el contexto en la ecuaci¨®n. ¡°Que se te recomiende la m¨²sica seg¨²n lo que est¨¢s haciendo: estudiando, corriendo, fregando...¡±, precisa Oramas. Lograr esto no es moco de pavo, sobre todo porque implica que la plataforma acceda de alguna manera a una informaci¨®n que ahora mismo est¨¢ fuera de su alcance. ¡°Mucho de esto se podr¨ªa conseguir por third party data (datos de terceros), es decir, que haya otra aplicaci¨®n que haya registrado tu informaci¨®n y luego los venda¡±, razona. Tambi¨¦n est¨¢ la posibilidad de que sea la persona quien introduzca sus preferencias: siempre escucho rap, pero hoy no me apetece, ponme zarzuelas o quiero escuchar grabaciones ac¨²sticas. ¡°Eso es un desaf¨ªo actualmente, y se est¨¢ investigando. Tambi¨¦n hay complicaciones de la interfaz y decisiones de producto que priman m¨¢s otros aspectos. Pero en general, se est¨¢ tomando m¨¢s conciencia de la necesidad de dar m¨¢s control al usuario¡±.
Puedes seguir a EL PA?S TECNOLOG?A RETINA en Facebook, Twitter, Instagram o suscribirte aqu¨ª a nuestra Newsletter.