La m¨²sica m¨¢s alegre y m¨¢s triste del mundo: un experimento con datos de Spotify
Cualquier persona con algo de conocimiento de programaci¨®n y el uso de software libre puede elaborar sus listas en el servicio de 'streaming' musical. Este experimento logra dos listas con las m¨¢s tristes y alegres del mundo
Los servicios de m¨²sica en streaming como Spotify, Google Music o Apple Music almacenan en sus servidores cerca de 30 millones de canciones, y entre ellas se puede encontrar m¨²sica excelente, muy buena, buena, regular, mala, penosa, deleznable y David Bisbal. A esta ingente cantidad de informaci¨®n hay que sumar la que generan sus usuarios al interactuar con este cat¨¢logo ¡ªpor ejemplo, etiquetando qu¨¦ canciones son sus preferidas; o escuchando obsesivamente esa canci¨®n¡ª, que permite personalizar, entre otras cosas, las recomendaciones musicales. Es el mismo mecanismo que permite a Netflix predecir que alguien que ha puntuado Daredevil con cinco estrellas igual no deber¨ªa perderse Jessica Jones. Un usuario marca en Spotify las canciones que m¨¢s le gustan y cada lunes le llega una selecci¨®n individualizada de m¨²sica muy similar. No es magia, son matem¨¢ticas.
De la misma forma que estas empresas buscan continuamente patrones que les permitan mejorar sus servicios, cualquier persona con conocimientos de programaci¨®n puede tambi¨¦n hacer uso de estos datos para responder, a menor escala, sus propias preguntas. Quiz¨¢, en nuestra Alta Fidelidad particular, queremos nuestra propia lista de las canciones m¨¢s tristes del mundo para poder escuchar durante el atasco de los lunes por la ma?ana. O quiz¨¢ queremos las canciones m¨¢s alegres para poner a todo trapo cuando se vuelvan a convocar elecciones: ?dos fiestas de la democracia en tan poco tiempo!
Lo mejor de todo es que el trabajo de selecci¨®n ya lo han hecho por nosotros los usuarios de Spotify al crear sus listas de reproducci¨®n p¨²blicas. Si accedemos a esos datos, podemos ver qu¨¦ canciones se incluyen m¨¢s en listas alegres y cu¨¢les en listas tristes. As¨ª que hemos desarrollado unos peque?os programas en Python ¡ªpara la descarga de los datos¡ª y R ¡ªpara el posterior an¨¢lisis. Hemos elegido Spotify porque es relativamente sencillo acceder a sus bases de datos. Los lectores con inquietudes t¨¦cnicas pueden obtener el c¨®digo utilizado en este repositorio.
Para hacernos esas dos recopilaciones que acabamos de mencionar, hemos descargado los nombres de las canciones que integran todas las listas de reproducci¨®n publicadas en Spotify que conten¨ªan en el t¨ªtulo la palabra sad (o alguno de sus sin¨®nimos) por una parte, y happy (y nuevamente sus sin¨®nimos) por otra. Hemos hecho las b¨²squedas en ingl¨¦s porque el n¨²mero de listas etiquetadas en ese idioma es bastante mayor que en espa?ol (s¨ª, hemos probado). En total hemos descargado 11.330 listas de reproducci¨®n tristes, con m¨¢s casi 330.000 canciones diferentes, y 8.931 listas de reproducci¨®n alegres, con m¨¢s de 350.000 temas distintos.
Una vez que tenemos estos datos, la tentaci¨®n de ver limitarse a mirar qu¨¦ canciones se repiten m¨¢s en cada lista es fuerte. Sin embargo, eso nos dar¨ªa como resultado que Sorry, de Justin Bieber, est¨¢ simult¨¢neamente entre las cinco canciones m¨¢s tristes y m¨¢s alegres. Hay un detalle importante: que una canci¨®n aparezca en el 10 % de las recopilaciones de m¨²sica triste no significa nada si aparece en un 15 % de listas etiquetadas con t¨¦rminos emocionalmente as¨¦pticos (m¨²sica, favoritos, etc): esperamos que la m¨²sica relacionada con una sensaci¨®n determinada aparezca en un porcentaje mayor de sus listas correspondientes. Para corregir esto, hemos descargado tambi¨¦n un conjunto de datos neutro que nos permita comprobar este nivel basal de cada tema: algo m¨¢s de 50000 listas de reproducci¨®n con m¨¢s de 1.600.000 canciones en total.
En total hemos descargado 11.330 listas de reproducci¨®n tristes, con m¨¢s casi 330.000 canciones diferentes, y 8.931 listas de reproducci¨®n alegres, con m¨¢s de 350.000 temas distintos
Bien, ?cu¨¢l es el resultado final? Despu¨¦s de analizar los datos seg¨²n los criterios que acabamos de mencionar, hemos hecho un r¨¢nking y hemos recopilado cerca de 50 canciones de cada tipo con las que hemos confeccionado unas listas que hemos publicado: las m¨¢s tristes [Spotify,YouTube] y las m¨¢s alegres [Spotify,YouTube]. Est¨¢n ordenadas de mayor a menor seg¨²n su relevancia, pero si quieren ¨²nicamente un caballo ganador, ¨¦stos ser¨ªan Build you up, de Kim Taylor, y Celeste, de Ezra Vine. Justin Bieber sigue por ah¨ª, pero nada es perfecto.
Los resultados contienen los tipos de m¨²sica que uno esperar¨ªa: mucho piano lento para la triste y ritmos animados para la alegre. No obstante, hay que tener en cuenta todas las limitaciones que conlleva el m¨¦todo escogido: en realidad, solamente hemos analizado un peque?o porcentaje de todas las canciones disponibles, y ¨²nicamente una min¨²scula proporci¨®n de todos los usuarios ha emitido su voto al publicar sus selecciones; pero incluso con esta peque?a fracci¨®n de los datos de Spotify hemos podido obtener resultados que tienen sentido.
Para llevar a cabo este proyecto no han hecho falta modern¨ªsimos equipos ni tirar de tarjeta de cr¨¦dito: de los c¨¢lculos se ha encargado un port¨¢til con casi 9 a?os de antig¨¹edad que se ha dejado un par de noches descargando las listas de canciones; todo el software empleado es libre y no ha habido que pagar ni un c¨¦ntimo en licencias. El an¨¢lisis de datos no solamente permite la incursi¨®n de cualquiera que tenga unos m¨ªnimos conocimientos de programaci¨®n y una base de datos a su disposici¨®n, sino que, en muchos casos, ni siquiera hace falta saber programar: simplemente hacen falta ganas, la pregunta que se quiera responder, los datos que podr¨ªan hacerlo, una hoja de c¨¢lculo y mucha paciencia. Miren por ejemplo lo que hace @NacionRotonda en sus ratos libres.
Jos¨¦ Mar¨ªa Mateos (@rinze) es analista de datos en una empresa de contenidos digitales.
Tu suscripci¨®n se est¨¢ usando en otro dispositivo
?Quieres a?adir otro usuario a tu suscripci¨®n?
Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.
FlechaTu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.
En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.