C¨®mo descubrir la verdad en Twitter
Ahora que cada vez m¨¢s gente utiliza las redes sociales como principal fuente de informaci¨®n, ?c¨®mo podemos distinguir lo que es verdad de lo que es mentira?
El 29 de octubre de 2012, fecha en que el hurac¨¢n Sandy azot¨® la ciudad de Nueva York, un tuitero malintencionado public¨® lo siguiente: "?LTIMA HORA: Confirmada la inundaci¨®n de la Bolsa de Nueva York. El parqu¨¦ se encuentra sumergido bajo casi un metro de agua", un mensaje que se propag¨® r¨¢pidamente a los informativos convencionales.
Solo que no era verdad.
Recientemente, esta clase de bromas, que se suelen publicar con la intenci¨®n de enga?ar, han recibido la denominaci¨®n de fake news. A veces, a los periodistas, las autoridades y los usuarios corrientes de las redes sociales les cuesta entresacar las noticias verdaderas de este raudal de desinformaci¨®n. Las redes sociales se est¨¢n convirtiendo en la principal fuente de informaci¨®n para muchas personas, as¨ª que encontrar la manera de juzgar si algo es verdadero o falso es cada vez m¨¢s importante.
Nosotros hemos desarrollado un marco de referencia, publicado en PLOS One, que eval¨²a la probabilidad de que un hecho del que se informa en un tuit corresponda al relato de un testigo presencial mediante la ponderaci¨®n de los indicios de si el autor del mensaje se encontraba o no en el lugar de los hechos.
Evaluar la fiabilidad de un tuit
Un principio establecido hace tiempo en los procedimientos penales es que los relatos de los testigos presenciales son m¨¢s fiables que lo que se cuenta de o¨ªdas. Por lo tanto, para juzgar si un tuit es digno de confianza tenemos que decidir si la informaci¨®n que contiene es de primera mano.
Nuestro esquema, desarrollado a partir de un trabajo anterior de Marie Truelove, analiza los detalles de un mensaje para establecer si se trata del relato de un testigo presencial. El punto de partida m¨¢s obvio es la georreferencia de los metadatos de algunos tuits. Lo que ocurre es que solamente una peque?a parte de los usuarios activa esta opci¨®n. Para encontrar otras fuentes de pruebas tuvimos que recurrir al contenido del propio tuit, es decir, al texto y a las fotograf¨ªas.
Primero buscamos indicios de que el autor estuvo presente en el suceso sobre el cual escribi¨®. Luego pusimos a prueba el resultado buscando indicios de que, en realidad, no estuvo all¨ª. En el texto, declaraciones como determinadas observaciones sobre el hecho (por ejemplo, el humo en el cielo en el caso de un incendio), las im¨¢genes adjuntas (como una fotograf¨ªa en directo de un partido de f¨²tbol), y la existencia de geoetiquetado en los metadatos corroboran que un usuario es un testigo digno de cr¨¦dito.
Adem¨¢s, identificamos aquellas pruebas en contra que indican que un tuitero no ha sido testigo presencial, por ejemplo, si se sit¨²a a s¨ª mismo en otro sitio o publica una imagen televisiva del suceso, y las utilizamos para verificar las anteriores. Si descubrimos que ambas se contradicen, se puede proceder a investigar la naturaleza del mensaje.
A continuaci¨®n, estos indicios, que se pueden extraer utilizando el aprendizaje autom¨¢tico, se eval¨²an con el fin de asignar al tuit una medida de credibilidad que va desde baja hasta alta.
Las dificultades
Nuestro sistema tiene que vencer dificultades importantes, entre ellas decidir si el tuit se ha generado a partir de la experiencia directa del suceso o mientras este se ve¨ªa en televisi¨®n.
Las im¨¢genes adjuntas pueden ser copias an¨®nimas procedentes de otras fuentes o reproducir sucesos del pasado que tuvieron lugar en el mismo sitio. Los tuiteros pueden publicar lo deseosos que est¨¢n de asistir a un acontecimiento que tendr¨¢ lugar despu¨¦s, pero al final no ir, o, por el contrario, posponer la publicaci¨®n de sus relatos presenciales hasta que est¨¢n de vuelta a casa una vez que el acontecimiento ha concluido.
El comportamiento de los testigos presenciales a la hora de publicar tambi¨¦n puede variar dependiendo del hecho de que se trate. Por ejemplo, los tuits en los que se informa por anticipado de la asistencia a determinado acontecimiento no se pueden detectar a menos que este est¨¦ programado. Asimismo, los que informan de que un suceso no ha ocurrido solamente aparecer¨¢n si este se ha predicho; por ejemplo, si no se producen las inundaciones y los apagones asociados a un cicl¨®n anunciados con anterioridad.
Para vencer estas dificultades, investigamos fundamentalmente las distintas fuentes de indicios contenidas en los tuits y aplicamos una serie de procesos para eliminar los menajes que no permiten obtener indicios de que quien publica est¨¢ presente en el lugar del os hechos, como pasa con los retuits.
Despu¨¦s utilizamos t¨¦cnicas supervisadas de aprendizaje autom¨¢tico para aplicar modelos de clasificaci¨®n dirigidos a obtener pruebas de los tuits restantes que aportan datos que demuestran que, quien mand¨® el tuit, estuvo presente en el sitio en cuesti¨®n.
Cuando descubrimos m¨²ltiples indicios para un mismo tuitero, podemos ponerlos a prueba por combinaci¨®n, demostrada aplicando la teor¨ªa de la evidencia de Dempster Shafer en el estudio que hemos publicado en PLOS One. Esta teor¨ªa nos permite combinar o fundir diferentes tipos de pistas que respaldan distintos niveles de certeza.
Verificar la credibilidad
Hemos descubierto que incluir indicios procedentes del texto y de las fotograf¨ªas adjuntas permite descubrir m¨¢s autores de tuits presentes en determinado suceso que cuando se los identifica ¨²nicamente a partir de las georreferencias.
Adem¨¢s, el n¨²mero de tuits que se pueden analizar en busca de pruebas corroborativas o contradictorias se multiplica cuando se identifican pruebas a favor y en contra en el historial de mensajes publicados.
Si se hubiese utilizado este sistema se habr¨ªa estimado que la medida de credibilidad del tuit sobre la inundaci¨®n de la Bolsa de Nueva York era baja, ya que faltaban indicios que confirmasen que su autor estaba presente en el sitio, no hab¨ªa ninguna imagen que proporcionase pruebas adicionales, y los tuits anteriores y posteriores no guardaban suficiente relaci¨®n con el hecho.
Si las agencias de noticias en particular tuviesen acceso a un marco de referencia como el nuestro para valorar los tuits de pretendidos testigos presenciales, todos podr¨ªamos confiar un poco m¨¢s en los informativos.
Este art¨ªculo fue publicado en?Pursuit. Lea el art¨ªculo original aqu¨ª.
Tu suscripci¨®n se est¨¢ usando en otro dispositivo
?Quieres a?adir otro usuario a tu suscripci¨®n?
Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.
FlechaTu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.
En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.