Usar inteligencia artificial para concienciar sobre la misoginia en Twitter
El procesamiento del lenguaje natural permite analizar qu¨¦ palabras son las m¨¢s repetidas respecto a un tema de discusi¨®n, los usuarios que m¨¢s insultos profieren o extraer el sentimiento que transmite un conjunto de tuits
Una de las redes sociales m¨¢s utilizadas hoy en d¨ªa es Twitter, donde diariamente millones de usuarios expresan sus opiniones en 280 caracteres. En este escaparate social diverso hay cabida para todo tipo de ideas, aunque muchos aprovechan el anonimato que ofrece la plataforma para desinhibirse y difundir insultos y mensajes de odio.
Como en la vida real, dicha aversi¨®n suele dirigirse a los colectivos m¨¢s desprotegidos. Un ejemplo de ello es la situaci¨®n que experimentan las mujeres con un puesto de responsabilidad que adem¨¢s tienen perfiles p¨²blicos en Twitter, las cuales son acosadas pr¨¢cticamente a diario. Por ello, muchas de ellas deciden borrar sus perfiles o hacerlos privados, con lo que las voces de estas se acaban silenciando y perdiendo.
La inteligencia artificial nos puede servir de ayuda para analizar las dimensiones reales del problema de los insultos mis¨®ginos en Twitter. A trav¨¦s del procesamiento del lenguaje natural, por ejemplo, podemos analizar desde una perspectiva socioling¨¹¨ªstica qu¨¦ palabras son las m¨¢s repetidas respecto a un tema de discusi¨®n, los usuarios que m¨¢s insultos profieren o incluso extraer el sentimiento que transmite un conjunto de tuits.
El primer paso para el an¨¢lisis ser¨ªa crearse una cuenta de desarrollador en Twitter y buscar con la ayuda de una biblioteca del lenguaje de programaci¨®n Python (como Tweepy) solo aquellos tuits que incluyan palabras pertinentes para la investigaci¨®n. En nuestro caso podr¨ªamos buscar tuits que contengan ¡°feminazi¡± y se manden en fechas concretas (como el d¨ªa de la mujer o tras la dimisi¨®n de un alto cargo), o nombres de usuario de mujeres bajo el ojo p¨²blico para analizar la opini¨®n de la mayor¨ªa de los usuarios sobre ellas.
Una vez extra¨ªdas las muestras, podemos utilizar herramientas de an¨¢lisis de datos para limpiar los textos y eliminar signos de puntuaci¨®n o s¨ªmbolos como ¡°@¡± o ¡°#¡±. El objetivo de este proceso es quedarnos con las palabras con m¨¢s significado, como adjetivos y sustantivos en espa?ol. Tambi¨¦n podr¨ªamos ir m¨¢s all¨¢ y realizar una lematizaci¨®n, separando cada palabra seg¨²n caracter¨ªsticas morfol¨®gicas como los sufijos y las ra¨ªces para su posterior an¨¢lisis. Tambi¨¦n puede resultarnos ¨²til aplicar un corrector ortogr¨¢fico que ¡°traduzca¡± la jerga de internet a un lenguaje m¨¢s est¨¢ndar.
Seguidamente, aplicamos algoritmos de aprendizaje autom¨¢tico con Python, que contiene bibliotecas de f¨¢cil acceso que simplifican notablemente el proceso de an¨¢lisis. As¨ª, a trav¨¦s de una funci¨®n podemos distinguir usuarios de g¨¦nero masculino y femenino gracias a sus nombres de usuario y una comparaci¨®n con una lista extra¨ªda del INE, donde aparecen nombres espa?oles asociados a un g¨¦nero.
Un siguiente paso para analizar los tuits es utilizar programas de inteligencia artificial para extraer conclusiones acerca del sentimiento que estos expresan. Podemos encontrar modelos de an¨¢lisis de sentimiento en la p¨¢gina web Hugging Face, basados en una tecnolog¨ªa de clasificaci¨®n de textos desarrollada por Google. Esta hace uso de una arquitectura de red neuronal y etiqueta las palabras seg¨²n su contexto y su posici¨®n en la frase, compar¨¢ndolo con millones de textos; para determinar si un tuit tiene m¨¢s contenido que exprese, por ejemplo, alegr¨ªa, tristeza o enfado.
Todas las herramientas citadas resultan ¨²tiles para diversos an¨¢lisis de naturaleza socioling¨¹¨ªstica. Precisamente, sirvieron para la realizaci¨®n por parte de la autora del trabajo final del M¨¢ster en Letras Digitales titulado Silenciadas en el ciberespacio: una aproximaci¨®n a la misoginia en l¨ªnea, donde se analiz¨® la opini¨®n de los usuarios de Twitter acerca de las mujeres Adriana Lastra y Macarena Olona en los respectivos d¨ªas de su dimisi¨®n en 2022. Tras el estudio, se descubrieron tuits graves amenazando la salud de ambas y clasificados mayoritariamente como ¡°enfado¡± por los modelos de inteligencia artificial. Tambi¨¦n, a trav¨¦s de un modelo que clasificaba el sentimiento como positivo o negativo, Lastra y Olona recibieron a lo largo de m¨¢s de 50.000 tuits unas cifras de un 93% y un 63% de comentarios negativos frente a un 7% y un 37% de comentarios positivos, respectivamente. Finalmente, se lleg¨® a la conclusi¨®n de que las medidas de prevenci¨®n contra el acoso mis¨®gino de la plataforma son poco efectivas, puesto que comprobamos que comunidades abiertamente mis¨®ginas como los llamados incels no son suficientemente sancionados y sus publicaciones segu¨ªan (y siguen siendo) legibles en Twitter.
Gran parte de la responsabilidad de acabar con la discriminaci¨®n recae en las propias instituciones, que deben velar por un internet igualitario. Para ello, las herramientas de inteligencia artificial anteriormente citadas pueden servir tanto a particulares como a empresas para analizar el fen¨®meno de forma global y contribuir a su extinci¨®n, adaptando las medidas a la naturaleza de los insultos y las caracter¨ªsticas de los usuarios que los profieren. En un futuro, quiz¨¢ sean las propias m¨¢quinas quienes act¨²en de moderadores ante la violencia en l¨ªnea usando una versi¨®n avanzada de estos algoritmos.
Blanca Garrido Salmer¨®n es ling¨¹ista computacional y egresada del M¨¢ster en Letras Digitales de la Universidad Complutense de Madrid.
Cr¨®nicas del Intangible es un espacio de divulgaci¨®n sobre las ciencias de la computaci¨®n, coordinado por la sociedad acad¨¦mica SISTEDES (Sociedad de Ingenier¨ªa de Software y de Tecnolog¨ªas de Desarrollo de Software). El intangible es la parte no material de los sistemas inform¨¢ticos (es decir, el software), y aqu¨ª se relatan su historia y su devenir. Los autores son profesores de las universidades espa?olas, coordinados por Ricardo Pe?a Mar¨ª (catedr¨¢tico de la Universidad Complutense de Madrid) y Macario Polo Usaola (profesor titular de la Universidad de Castilla-La Mancha).
Puedes seguir a EL PA?S Tecnolog¨ªa en Facebook y Twitter o apuntarte aqu¨ª para recibir nuestra newsletter semanal.
Tu suscripci¨®n se est¨¢ usando en otro dispositivo
?Quieres a?adir otro usuario a tu suscripci¨®n?
Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.
FlechaTu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.
En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.