La inteligencia artificial puede medir la polarizaci¨®n pol¨ªtica
La sociolog¨ªa, la ling¨¹¨ªstica y la inform¨¢tica se unen para estudiar este fen¨®meno en las redes sociales
Desde hace un tiempo, se afirma que la sociedad est¨¢ polarizada, pero ?c¨®mo podemos comprobar si es cierto? ?Se puede medir la polarizaci¨®n? Se puede. La sociolog¨ªa, la ling¨¹¨ªstica y la inform¨¢tica se unen para estudiar este fen¨®meno en la esfera p¨²blica, muy bien representada hoy d¨ªa en las redes sociales, donde los ciudadanos comparte su postura sobre cualquier tema sin complejos. Mediante t¨¦cnicas de procesamiento del lenguaje natural y aprendizaje autom¨¢tico podemos analizar los comentarios que se publican en las redes.
Entendemos por postura polarizada aquella que se muestra a favor o en contra de una idea o mensaje, sin considerar los puntos intermedios. Entendemos, tambi¨¦n, que una opini¨®n que no muestra argumentos es una opini¨®n emotiva, fruto m¨¢s del sentimiento que del razonamiento. Teniendo esto en cuenta, para estudiar la polarizaci¨®n debemos analizar un gran n¨²mero de opiniones. Esas opiniones se reflejan en los comentarios publicados en redes sociales, por lo tanto, podemos recoger esos comentarios y estudiar si muestran una postura emotiva o, por el contrario, reflejan razonamiento y exponen argumentos meditados.
Lo primero es crear un corpus, o base de datos de comentarios, extra¨ªdo de una red social. Esos comentarios deben referirse a un mismo tema, por ejemplo, unas elecciones. Una vez tenemos nuestro corpus, identificamos qu¨¦ rasgos del lenguaje natural (que no es otra cosa que el lenguaje humano) nos sirven como evidencia de emotividad o de argumentaci¨®n. Por ejemplo, muchos emoticonos, may¨²sculas o signos de admiraci¨®n indican que, posiblemente, el grado de emotividad del comentario es mayor que el de otro que contiene muchos verbos de argumentaci¨®n. Para que el programa nos entienda, hemos de convertir estas evidencias en n¨²meros. Esto lo conseguimos hallando el porcentaje que hay de cada elemento ¡ªemoticonos, may¨²sculas, signos de admiraci¨®n, verbos, etc.¡ª en cada comentario. En otras palabras, las evidencias son los valores que sirven para representar los comentarios de manera num¨¦rica. Esta b¨²squeda y registro de evidencias en el texto es, a grandes rasgos, lo que llamamos procesamiento del lenguaje natural.
La segunda parte del proceso es la que implica el uso de la inteligencia artificial y se divide en dos fases. La primera fase requiere mentes humanas, pues es necesario tomar una parte del corpus de comentarios y etiquetar manualmente unos cuantos que le servir¨¢n de ejemplo al algoritmo de aprendizaje autom¨¢tico, es decir, al programa, para ?aprender?. Dicho de otra manera, una o varias personas etiquetan a mano un pu?ado de comentarios como ?emotivos? o ?no emotivos?. La segunda fase consiste en entrenar el algoritmo. Este toma los datos etiquetados previamente, detecta los patrones que le sirven para clasificar correctamente y genera un modelo (que es una representaci¨®n de esos patrones detectados y que sirve para clasificar nuevos mensajes). As¨ª, cuando procesemos el resto de los comentarios que tenemos guardados en nuestro corpus, el modelo los etiquetar¨¢ autom¨¢ticamente, bas¨¢ndose en lo que ha aprendido en esta fase de entrenamiento.
Finalmente, procesar nuestro corpus completo usando el modelo generado nos permite conocer cu¨¢ntos comentarios son emotivos y cu¨¢ntos no. Esta t¨¦cnica no busca tanto saber cu¨¢ntos de los comentarios est¨¢n a favor y cu¨¢ntos en contra de una opini¨®n ¡ªlo cual se podr¨ªa averiguar empleando otras tecnolog¨ªas como el an¨¢lisis del sentimiento¡ª, sino, m¨¢s bien, medir cu¨¢nta emotividad existe en la muestra analizada, para poder concluir si en dicha muestra impera la polarizaci¨®n.
Este fue un modelo real que se construy¨® en el marco de un Trabajo de fin de M¨¢ster del M¨¢ster de Letras Digitales de la Universidad Complutense de Madrid para estudiar los comentarios relacionados con la campa?a electoral a la Asamblea de Madrid de 2021, publicados en YouTube. El modelo fue mejorado incluyendo otros par¨¢metros a tener en cuenta, como la longitud del texto, adem¨¢s de aplicar an¨¢lisis del sentimiento para obtener mayor precisi¨®n en la clasificaci¨®n de los comentarios. Asimismo, se constat¨® que el modelo era capaz de identificar con seguridad comentarios emotivos, pero que la etiqueta opuesta no implica tanto que el comentario sea razonado y no emotivo, sino que no se puede identificar la emotividad con claridad. De 16.691 comentarios analizados, 8.230 fueron etiquetados por el modelo como ¡°emotivos¡±, lo cual indica un alto porcentaje de emotividad confirmada en la muestra, es decir, aproximadamente la mitad de los comentarios carecen de rasgos de razonamiento y contienen evidencias de subjetividad, lo que sugiere un nivel importante de polarizaci¨®n en el contexto estudiado.
Lys Mayor Due?as es ling¨¹ista computacional, egresada?del M¨¢ster de Letras Digitales de la Universidad Complutense de Madrid.
Cr¨®nicas del Intangible es un espacio de divulgaci¨®n sobre las ciencias de la computaci¨®n, coordinado por la sociedad acad¨¦mica SISTEDES (Sociedad de Ingenier¨ªa de Software y de Tecnolog¨ªas de Desarrollo de Software). El intangible es la parte no material de los sistemas inform¨¢ticos (es decir, el software), y aqu¨ª se relatan su historia y su devenir. Los autores son profesores de las universidades espa?olas, coordinados por Ricardo Pe?a Mar¨ª (catedr¨¢tico de la Universidad Complutense de Madrid) y Macario Polo Usaola (profesor titular de la Universidad de Castilla-La Mancha).
Puedes seguir a EL PA?S TECNOLOG?A en Facebook y Twitter o apuntarte aqu¨ª para recibir nuestra newsletter semanal.
Tu suscripci¨®n se est¨¢ usando en otro dispositivo
?Quieres a?adir otro usuario a tu suscripci¨®n?
Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.
FlechaTu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.
En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.