El anonimato va camino de desaparecer
Con solo 15 atributos demogr¨¢ficos es posible identificar a cada uno de los ciudadanos de Estados Unidos
Hasta ahora nos identificaba nuestro nombre, un n¨²mero de DNI, un n¨²mero de tel¨¦fono, una direcci¨®n postal o de email. Bastaba con ocultar estos detalles en una base de datos para que no pudiera vincularse una serie de informaciones con su propietario. Ya no.
El reguero de datos que dejamos m¨¢s la capacidad de almacenarlos y tratarlos hacen que sea cada vez m¨¢s sencillo identificarnos individualmente a partir de lo que hacemos o somos. El anonimato ya no depende de que alguien averig¨¹e nuestro nombre o tel¨¦fono. Ahora nuestro comportamiento o identidad puede desanonimizarnos.
El anonimato ya no depende de que alguien averig¨¹e nuestro nombre o tel¨¦fono. Nuestro comportamiento puede desanonimizarnos.
Las oficinas de censo, hospitales o empresas comparten muestras anonimizadas de sus inmensas bases de datos por transparencia o para estudios y comprobaciones. El peque?o tama?o de la muestra hac¨ªa dif¨ªcil que esa informaci¨®n acabara vincul¨¢ndose a un individuo.
Un nuevo estudio publicado por Nature Communications determina que esa incertidumbre es cuantificable. Y puede eliminarse. La coincidencia de unos datos no ten¨ªa por qu¨¦ implicar que era exactamente esa persona. Con 15 atributos es suficiente para distinguir a cada uno de los estadounidenses, sea cual sea el tama?o de la muestra. "Aunque puede haber mucha gente que tiene 30 y pico a?os, es hombre, vive en Nueva York, muchos menos nacieron un 5 de enero de 1985, conducen un deportivo rojo y viven con dos ni?as y un perro", dice Yves-Alexandre de Montjoye, profesor del Imperial College de Londres y uno de los autores de la investigaci¨®n.
Los factores decisivos no son siempre los mismos o en la misma medida: a veces es el estado civil y otra la raza o cualquier otro. Pero solo tomando 15 factores el modelo es capaz de certificar con una probabilidad del 99,98% que la persona que buscamos es un perfil ¨²nico entre una enorme base de datos.
Para encontrar a ese individuo hay que conocerlo o tener acceso obviamente a otra base de datos que nos d¨¦ parte de la informaci¨®n equivalente para cotejar. Parece dif¨ªcil, pero la cantidad de combinaciones que pueden darse es cada vez mayor. La informaci¨®n sobre nosotros que puede encontrarse p¨²blicamente es cada d¨ªa mayor.
A lo largo de la ¨²ltima d¨¦cada, los investigadores han encontrado que puede desanonimizarse con multitud de variables si el n¨²mero de datos es suficiente: uso de redes sociales, datos gen¨¦ticos, localizaci¨®n, gasto de tarjeta de cr¨¦dito, historial de navegaci¨®n, estilo de escritura, c¨®digo inform¨¢tico.
El presidente Donald Trump ha sido una v¨ªctima reciente de la posibilidad de vincular informaci¨®n obtenida por ah¨ª con muestras p¨²blicas de bases de datos. El New York Times public¨® hace unos meses unos art¨ªculos de investigaci¨®n sobre la declaraci¨®n de renta del presidente. El peri¨®dico logr¨® desanonimizar informaci¨®n fiscal de Trump en una lista de los contribuyentes m¨¢s ricos del pa¨ªs a partir de unos datos que les hab¨ªa pasado una fuente: "El Times fue capaz de encontrar datos coincidentes en la informaci¨®n fiscal de los mayores contribuyentes (una base de datos disponible p¨²blicamente que cada a?o incluye una muestra de un tercio de esos contribuyentes, con los datos identificativos suprimidos)", dice el peri¨®dico.
"La carga de la prueba debe recaer en el controlador de los datos, no en los defensores de la privacidad"
"Los ataques solo van a mejorar", dice Arvind Narayanan, profesor de la Universidad de Princeton y autor del estudio que demostr¨® que en una base de datos de 2006 solo con la informaci¨®n de evaluaci¨®n de pel¨ªculas de medio mill¨®n de suscriptores de Netflix era posible identificar a individuos. Es decir, la capacidad de vincular nuestro pasado con informaci¨®n de bases de datos an¨®nimas pero p¨²blicas solo va a mejorar.
"Nuestra recomendaci¨®n", a?ade Narayanan, "es que la carga de la prueba recaiga en el controlador de los datos para que demuestre fehacientemente que los datos an¨®nimos no pueden ser ligados a individuos, en lugar de que sean los defensores de la privacidad los que deban probar que esa relaci¨®n es posible."
Los m¨¦todos deber¨¢n ser otros. El uso de grandes bases de datos ayuda a entender una enfermedad, la movilidad en una ciudad u otros comportamientos humanos. Esta labor deber¨¢ seguir haci¨¦ndose, pero ser¨¢ cada d¨ªa m¨¢s dif¨ªcil. Los organismos o empresas que compartan o pierdan parte de sus bases de datos anonimizadas se cre¨ªan invulnerables al no estar vinculadas a informaci¨®n personal. Cada vez m¨¢s sin embargo lo que hacemos queda registrado y es informaci¨®n personal, est¨¦ o no ligada a un nombre o identificador ¨²nico.
"Necesitamos est¨¢ndares m¨¢s altos para lo que constituyan datos an¨®nimos legalmente y empezar a usar herramientas de ingenier¨ªa que permitan usar datos que logren preservar la privacidad de la gente", dice De Montjoye.
Este tipo de estudios deben tenerse en cuenta cuando las grandes tecnol¨®gicas dicen que no vinculan informaci¨®n personal con nuestros "datos". Para desanonimizar a alguien, ya no hace falta el carn¨¦ de identidad.
Tu suscripci¨®n se est¨¢ usando en otro dispositivo
?Quieres a?adir otro usuario a tu suscripci¨®n?
Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.
FlechaTu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.
En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.