Cuatro compras con la tarjeta bastan para identificar a cualquier persona
Los patrones de uso de las tarjetas permiten descubrir la identidad del 90% de una muestra de 1,1 millones de personas an¨®nimas, seg¨²n demuestra un estudio del MIT
Cuatro gestos tan triviales como pagar el billete de metro, la comida del mediod¨ªa, las zapatillas en una tienda deportiva o las entradas al cine permiten identificar a casi cualquier persona. Aunque no se sepa el nombre o el n¨²mero de cuenta, un estudio con datos de compra de 1,1 millones de personas revela la identidad en m¨¢s del 90% de los casos. Es el poder de los metadatos y el big data.
Cuando estall¨® el caso Snowden, en Estados Unidos se produjo un gran esc¨¢ndalo con uno de los programas de espionaje de la NSA que recopilaba millones de llamadas telef¨®nicas. Las autoridades estadounidenses aclararon enseguida que no espiaban el contenido de las conversaciones en s¨ª sino metadatos como qui¨¦n llamaba a qui¨¦n, a qu¨¦ hora o durante cu¨¢nto tiempo. Google o Facebook tambi¨¦n los usan para mejorar sus servicios u ofrecer publicidad m¨¢s personalizada. En principio, la agregaci¨®n de este tipo de datos de forma an¨®nima en grandes bases no plantear¨ªa una gran amenaza a la privacidad de las personas. Esa presunci¨®n se ha demostrado ahora falsa.
Un grupo de investigadores del Media Lab del Instituto Tecnol¨®gico de Massachusetts (MIT) ha dise?ado un par de algoritmos matem¨¢ticos que permiten identificar a una persona bas¨¢ndose en sus h¨¢bitos de compra. Consiguieron que un gran banco de un pa¨ªs de la OCDE (por razones obvias, no dicen ni qu¨¦ banco ni qu¨¦ pa¨ªs) les dejara aplicar sus algoritmos a una base de datos con las transacciones de pagos electr¨®nicos de 1,1 millones de clientes en unas 10.000 tiendas durante los meses de enero y marzo de 2014.
Las bases con inmensas cantidades de datos anonimizados sirven para mostrar la unicidad del ser humano
"Con un promedio de cuatro transacciones, el d¨ªa y la tienda, basta para identificar de forma exclusiva a las personas en el 90% de los casos", dice el investigador del MIT y coautor de la investigaci¨®n, Yves-Alexandre de Montjoye. "La l¨®gica que subyace en esto reside en que muchas personas compran algo en una determinada tienda (Mango, por ejemplo) un d¨ªa determinado (pongamos, ayer). Sin embargo, solo algunas de ellas tambi¨¦n comprar¨¢n en determinado H&M ese mismo d¨ªa. Y a¨²n menos ir¨¢n a comer al d¨ªa siguiente en la misma zona. En cuanto sepas cuatro lugares o tiendas y d¨ªas, el 90% de las veces hay una y solo una persona en toda la base de datos que compra algo en cuatro lugares en esos cuatro d¨ªas", explica.
De los archivos del banco usados para el estudio, los investigadores solo dispon¨ªan del d¨ªa (renunciaron a registrar la hora, lo que habr¨ªa afinado a¨²n m¨¢s sus resultados) y el comercio donde se realiz¨® la compra. Como es l¨®gico, cada transacci¨®n lleva tambi¨¦n un identificador de usuario en forma de una combinaci¨®n alfanum¨¦rica de 8 d¨ªgitos, que permite a la entidad pasar el cobro al que hizo la compra. A ellos les sirvi¨® para confirmar sus porcentajes de acierto.
Hay un cuarto metadato que parecer¨ªa irrelevante pero, en realidad, da pistas extra para identificar a las personas. Se trata del importe de la compra. Los autores del estudio, publicado en Science, agruparon los importes en intervalos. No necesitaron el precio exacto para ampliar las posibilidades de volver a identificar al comprador.
"Analizamos tambi¨¦n qu¨¦ pasaba si sabemos el precio aproximado de lo que has comprado. Por ejemplo, unos 30 d¨®lares en Mango, 20 en H&M, 7 para la comida... Esto, en la pr¨¢ctica, hace a las personas incluso m¨¢s ¨²nicas. Aqu¨ª, con solo tres puntos (tiendas, d¨ªa y precio) tienes un 94% de posibilidades de volver a identificar a un individuo", comenta el investigador franc¨¦s.
Es la paradoja de este tiempo. Las bases con inmensas cantidades de datos anonimizados sirven para mostrar la unicidad del ser humano. Como dice de Montjoye, no se trata tanto de la?predictibilidad de los humanos, "si no m¨¢s sobre c¨®mo nuestra conducta (y nuestros patrones de compra) nos hacen ¨²nicos en comparaci¨®n con los dem¨¢s".
Las mujeres y los ricos, m¨¢s identificables
Los autores del estudio tambi¨¦n investigaron el efecto del g¨¦nero o el nivel de ingresos en la probabilidad de la reidentificaci¨®n. Aunque las mujeres solo eran el 24% de la muestra analizada, comprobaron que ellas son, de promedio, 1,2 veces m¨¢s identificables. El mismo fen¨®meno sucede con el nivel de ingresos. Los compradores con mayor promedio de gasto tienen 1,7 veces m¨¢s probabilidades de ser identificados.
El objetivo del estudio no era explicar por qu¨¦ las compras permiten identificar a las personas, pero los investigadores jugaron con un par de posibles variables para explicar estas diferencias. Vieron que la forma en la que uno reparte el tiempo entre las distintas tiendas era el mejor predictor para saber si el comprador era mujer o de altos ingresos. Estos dos grupos muestran un patr¨®n de mayor diversidad a la hora de comprar que los hombres o las personas de menores ingresos.
Los metadatos pueden ser datos personales", dice el director de la AEPD
Aunque los cient¨ªficos del MIT sostienen que habr¨¢ que hacer m¨¢s estudios en otros ¨¢mbitos, ellos apuestan por que los datos de navegaci¨®n en internet, los movimientos bancarios o los datos de transporte y movilidad tambi¨¦n tienen un alto grado de unicidad y permitir¨ªan de forma inequ¨ªvoca distinguir a una persona de otra. En un pa¨ªs como Espa?a, donde seg¨²n las estad¨ªsticas del Banco de Espa?a hay casi 70 millones de tarjetas de cr¨¦dito y d¨¦bito con las que se hacen operaciones de unos 100.000 millones de euros, la sola idea de se pueda identificar a alguien por el uso que hace de su tarjeta, espanta.
Por fortuna, los autores del estudio tuvieron que firmar un acuerdo de confidencialidad con el banco para poder hurgar en su base de datos, que se suponen a buen recaudo. Pero, como concluyen en su trabajo, el problema fundamental que revela esta investigaci¨®n es que las leyes sobre privacidad descansan sobre una premisa que ellos han demostrado que no es cierta. Por muy dura que sea la norma, esta solo es aplicable a los datos personales, es decir, aquellos que permiten identificar a un individuo. Los m¨¢s obvios son su nombre, su cara, su direcci¨®n o su tel¨¦fono. Pero, ?qu¨¦ pasa con los metadatos como la compra de unas zapatillas en una tienda determinada?
"Los metadatos pueden ser datos personales y muchas veces lo son", recuerda el director de la Agencia Espa?ola de Protecci¨®n de Datos, Jos¨¦ Luis Rodr¨ªguez. "Para que no sean datos personales tienen que ser an¨®nimos, con una disociaci¨®n irreversible", a?ade. Si, como en esta investigaci¨®n, se puede hacer el camino inverso desde los metadatos a la identidad de la persona, entonces s¨ª se le aplicar¨ªa la legislaci¨®n sobre privacidad. Para Rodr¨ªguez, el problema de fondo es que "en la medida en que existe cada vez m¨¢s informaci¨®n disponible, se debilita la anonimizaci¨®n porque hay m¨¢s posibilidades de combinar y, por lo tanto, de identificar o individualizar a la persona".
Tecnolog¨ªa y privacidad, condenados a entenderse
La revista Science incluye hoy un especial sobre las conflictivas relaciones entre la tecnolog¨ªa y privacidad. A lo largo de una serie de art¨ªculos se repasan nuevas amenazas como el reconocimiento facial o las cada vez m¨¢s retorcidas maneras que encuentran empresas y gobiernos para aprovecharse de los datos de los ciudadanos. Tambi¨¦n aparece un revelador art¨ªculo sobre el derecho al olvido.
La investigadora del Instituto Tecnol¨®gico de Worcester Susan Landau mantiene en uno de los art¨ªculos que las personas han perdido la capaz de proteger sus datos personales y su privacidad. Apoyadas en la facilidad que tienen las m¨¢quinas para establecer conexiones entre los datos, las empresas y gobiernos tienen cada vez m¨¢s f¨¢cil recopilar grandes cantidades de informaci¨®n y sacarle provecho. Menciona, por ejemplo, una vieja investigaci¨®n suya que demostr¨® que un internauta medio necesitar¨ªa 244 horas para leerse todas las pol¨ªticas de privacidad que hay en las p¨¢ginas que se visitan. Para ella, los viejos m¨¦todos para proteger la privacidad ya no sirven.
El director de la AEPD, Jos¨¦ Luis Rodr¨ªguez, no cree que haya que tirar todo a la basura y renunciar al derecho a la privacidad porque sea cada vez m¨¢s complicado ejercerlo. "Mantener una esfera de privacidad es imprescindible para el desarrollo de la persona", recuerda.
En lo que s¨ª est¨¢ de acuerdo es en que los riesgos son cada vez mayores. Por eso, coincide con Landau en que, adem¨¢s de una legislaci¨®n firme, hacen falta soluciones tecnol¨®gicas que protejan los datos personales. "No es admisible que la tecnolog¨ªa evolucione solo por el lado de la recopilaci¨®n de los datos, deber¨ªa ir pareja con sistemas que los protejan", dice.
En otro de los trabajos, se revisa el impacto que est¨¢ teniendo el llamado derecho al olvido, tras la resoluci¨®n de la Justicia europea sobre un caso espa?ol. En el art¨ªculo, el profesor de la Universidad de Georgetown, Abraham Newman, desmonta dos mitos en los que se apoyan quienes critican la mera existencia del derecho al olvido en internet.
Por un lado, niega que la desindexaci¨®n de informaci¨®n personal de los buscadores da?e a la libertad de expresi¨®n y el derecho a la informaci¨®n. Al fin y al cabo, la informaci¨®n no se borra, solo se oculta de los ojos de Google. Por el otro, rechaza, como ha sostenido Google, que el trabajo de eliminar unos miles de enlaces pueda da?ar la salud econ¨®mica de la compa?¨ªa. Y da un dato: En los primeros cinco meses de aplicaci¨®n de la resoluci¨®n judicial, el buscador ha revisado 180.000 peticiones de retirada, aceptando el 40%. Mientras, en un solo mes, el de diciembre pasado, tuvo que atender peticiones de retirada de nueve millones de enlaces por posible infracci¨®n de derechos de autor.
Tu suscripci¨®n se est¨¢ usando en otro dispositivo
?Quieres a?adir otro usuario a tu suscripci¨®n?
Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.
FlechaTu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.
En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.