Un an¨¢lisis de 1,3 millones de tuits sobre Casado y Ayuso da una ligera ventaja a la presidenta madrile?a
Dos investigadores espa?oles han creado un modelo capaz de analizar el sentimiento en Twitter, que se ha convertido en uno de los m¨¢s usados del mundo
Los mensajes en Twitter sobre pol¨ªtica en Espa?a suelen ser negativos. Pero un an¨¢lisis de la conversaci¨®n mediante 1,3 millones de tuits desde que estall¨® la crisis en el Partido Popular hasta este lunes demuestra que aunque nadie se salva, Isabel D¨ªaz Ayuso recibe un sentimiento ligeramente m¨¢s positivo. Hasta el viernes al mediod¨ªa, sin embargo, el 90% de los mensajes fueron negativos, tanto los que se refer¨ªan a Ayuso como a Pablo Casado. Desde la publicaci¨®n, ese d¨ªa, de un duro comunicado contra la direcci¨®n nacional de su partido, la presidenta madrile?a mejora ligera pero significativamente su posici¨®n.
Los modelos de inteligencia artificial que analizan el lenguaje y son capaces de entenderlo o generarlo han mejorado mucho en los ¨²ltimos a?os. El an¨¢lisis sobre los tuits de la crisis del PP ha sido realizado para EL PA?S por un grupo de investigadores de la Universidad de Cardiff (Gales). Los espa?oles Jos¨¦ Camacho Collados y Luis Espinosa Anke, investigadores de esa universidad brit¨¢nica, han creado un modelo que analiza con precisi¨®n si el sentimiento de un tuit es positivo, negativo o neutral. Su herramienta, llamada TweetEval, se ha convertido en un ¨¦xito sin precedentes en los ¨²ltimos meses: de tener unos miles de descargas en enero de 2021 se ha disparado hasta los 15 millones en apenas un a?o, y compite en la liga de modelos generados por gigantes como Google, Meta u OpenAI. La clasificaci¨®n puede seguirse en la compa?¨ªa que se ha convertido en el centro de estos modelos de c¨®digo abierto, HuggingFace. Junto a Camacho y Espinosa son autores del modelo dos empleados del laboratorio de investigaci¨®n de Snapchat: Francesco Barbieri y Leonardo Neves.
¡°No sabemos el porqu¨¦ de esta explosi¨®n¡±, explica Camacho sobre el ¨¦xito de su programa. ¡°Quiz¨¢ son trabajadores de empresas que quieren analizar c¨®mo va su marca o pol¨ªticos en Twitter¡±, a?ade. En el fondo, es una nueva manera de medir estados de opini¨®n, como una encuesta, aunque tiene sus complejidades. ¡°Es una forma barata de escanear Twitter sobre tu marca¡±, resume Espinosa. Sin apenas recursos, y con muestras relativamente peque?as, partidos pol¨ªticos, clubes deportivos o productores de cine pueden hacerse una idea de c¨®mo respira esta red social ante cualquier novedad o tendencia.
En Hugging Face tampoco saben el porqu¨¦ de este ¨¦xito repentino, m¨¢s all¨¢ de dar algo de contexto a esos millones: ¡°El n¨²mero de descargas puede variar mucho. No significa que CardiffNLP [otro nombre para TweetEval] sea m¨¢s usado que otros modelos necesariamente¡±, dice Omar Sanseviero, ingeniero de Hugging Face. ¡°Podr¨ªa significar que unas pocas compa?¨ªas lo est¨¢n usando de manera muy intensa. No podemos saberlo realmente. De todos modos, es genial e impresionante ver un uso tan grande de modelos que no vienen de grandes laboratorios de investigaci¨®n¡±, a?ade. Es decir, cada descarga del modelo de Cardiff no implica un uso estrictamente nuevo, sino que la misma organizaci¨®n puede hacer varias descargas del modelo para mirar casos similares. Y cada uno de esos usos cuenta como una descarga.
La sencillez de utilizar modelos as¨ª tiene sus peligros: hay que entender qu¨¦ se hace y para qu¨¦. En casos puntuales la muestra puede estar sesgada, quiz¨¢ hay conversaci¨®n artificial provocada por campa?as espec¨ªficas o incluso pueden colarse tuits de otros temas si las palabras clave son confusas. A pesar de los reparos, como en el caso del PP, seguir una tendencia fiable es relativamente sencillo si no se hacen grandes extrapolaciones.
El autor del an¨¢lisis sobre el PP, Dimosthenis Antypas, ve¨ªa por ejemplo hasta el viernes una foto clara: ¡°Los resultados indicaban que el sentimiento p¨²blico, al menos en Twitter, iba en una sola direcci¨®n, con m¨¢s del 90% de los mensajes que mencionan a Ayuso o Casado clasificados como negativos. No hab¨ªa una diferencia significativa entre los dos pol¨ªticos¡±, explica. Pero entonces algo cambi¨® y en Twitter salt¨® algo el mismo viernes que se ir¨ªa reflejando en los medios, la manifestaci¨®n del domingo y las sensaciones al principio de esta semana: Ayuso, por alg¨²n motivo, mejor¨®. ¡°Sin saber en absoluto lo que sucedi¨®, asumo que algo ocurri¨® despu¨¦s del viernes a mediod¨ªa que hizo que la opini¨®n p¨²blica sobre Ayuso mejorara. Se dispar¨® alrededor del viernes por la noche¡±, precisa Antypas, que no sigue de cerca la pol¨ªtica espa?ola.
El cambio no es extraordinario, pero es significativo. Los comentarios positivos sobre Pablo Casado no var¨ªan; los de Ayuso, s¨ª. ¡°Isabel, muchos ¨¢nimos y todo mi apoyo!! Eres muy grande y te invito a que fiches por Vox¡±, ¡°presidenta, contigo siempre. ?nimo y gracias¡±. El entusiasmo que despierta su figura es otro de los motivos que puede levantar su sentimiento: tiene m¨¢s fans que Casado.
La pol¨ªtica en Espa?a (y en otros pa¨ªses tambi¨¦n) suele ser negativa. En un art¨ªculo cient¨ªfico anterior de estos investigadores, descubrieron que los tuits m¨¢s cr¨ªticos de diputados en Espa?a, el Reino Unido y Grecia tienden a recibir muchos m¨¢s retuits que los positivos. Tambi¨¦n detectaron que los pol¨ªticos que est¨¢n en el Gobierno escriben m¨¢s mensajes positivos que la oposici¨®n: en Espa?a el 84% de los textos que publica Pedro S¨¢nchez son positivos, los de Casado son negativos en un 63%. Es algo l¨®gico, uno ocupa la presidencia y el otro est¨¢ en la oposici¨®n, y as¨ª lo confirman los datos.
Fuera de la pol¨ªtica, tambi¨¦n domina el enfado, pero con menor intensidad: ¡°Si tomas un tuit aleatorio en Espa?a, la distribuci¨®n es 46% negativo, 16% neutro y 39% positivo; est¨¢ m¨¢s o menos equilibrado¡±, dice Camacho.
Un sector en auge
Este campo del procesamiento de lenguaje natural est¨¢ viviendo un verdadero bum. El art¨ªculo cient¨ªfico que marca hoy casi todas las investigaciones es uno de Google de finales de 2018: ¡°Cambi¨® la estructura de base y ya instaur¨® tener un mismo modelo que aprende de colecciones de textos muy grandes¡±, dice Camacho, lo que supone cambios enormes en pocos a?os: ¡°Nuestro mundo cambia muy r¨¢pido, ahora el 90% de art¨ªculos acad¨¦micos usa esto, que es algo que en 2018 no exist¨ªa¡±, a?ade.
La velocidad a la que cambia la capacidad de las m¨¢quinas para entender el lenguaje y producirlo es enorme. Pero queda mucho por hacer. Ahora un modelo que funciona bien para entender Twitter, no es capaz de escribir un art¨ªculo de peri¨®dico y mucho menos una sentencia judicial. Cada campo se nutre de bases de datos propias. Pero eso ir¨¢ cambiando tambi¨¦n con los a?os. ¡°Hay un l¨ªmite de lo que se puede hacer con reconocimiento de patrones y con millones y millones de datos. Solo imitan lo que han visto pero no razonan. Es una manera muy diferente de aprender el lenguaje. El desaf¨ªo mayor es que estos modelos entiendan el lenguaje. Por ejemplo que digas que tu nieto vive en Granada y el modelo sepa que all¨ª est¨¢ la Alhambra. Ahora eso no ocurre¡±, dice Camacho.
El ¨¦xito de su invento ha llevado a estos investigadores a querer popularizarlo. En unas semanas colgar¨¢n una p¨¢gina donde se podr¨¢n hacer consultas con peque?as muestras sobre casos como el de Ayuso y Casado. Hay ya un mont¨®n de art¨ªculos cient¨ªficos hechos en base a su modelo: ¡°El sentimiento en general tiene una pata en muchas otras tareas con valor¡±, dice Espinosa. ¡±Se puede usar la informaci¨®n de sentimiento para mejorar por ejemplo un modelo de prevenci¨®n de suicidio. Tambi¨¦n hemos visto desinformaci¨®n sobre covid o polarizaci¨®n¡±, a?ade. Hay quien lo ha usado, por ejemplo, para ver si las canciones de ¨¦xito son cada vez m¨¢s negativas. Resulta que s¨ª.
Puedes seguir a EL PA?S TECNOLOG?A en Facebook y Twitter o apuntarte aqu¨ª para recibir nuestra newsletter semanal.
Tu suscripci¨®n se est¨¢ usando en otro dispositivo
?Quieres a?adir otro usuario a tu suscripci¨®n?
Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.
FlechaTu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.
En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.