Tus datos ¨ªntimos son una mina
La digitalizaci¨®n de la vida cotidiana genera miles de registros - La 'miner¨ªa de datos' sirve para la investigaci¨®n m¨¦dica o la lucha contra el terror - Las cifras anticipan nuestros actos
En nuestro quehacer cotidiano, cada vez m¨¢s digitalizado, generamos constantemente datos sobre nuestros h¨¢bitos. Dejamos pistas en todas partes. Al comprar en el supermercado pasamos la tarjeta de fidelidad y, clic, quedamos registrados: cada semana, por ejemplo, junto a la carne, la verdura y los huevos, solemos comprar una cu?a de parmesano y, s¨®lo una vez al mes, un cart¨®n de helado de vainilla. Luego enviamos SMS con el m¨®vil y, clic, nuestro registro indica con cu¨¢nta gente nos relacionamos y si somos un usuario frecuente. Quiz¨¢ despu¨¦s, en la oficina, navegamos un rato; leemos un par de peri¨®dicos, mandamos tres e-mails y compramos un billete de tren; clic, clic, clic...
Habr¨¢ modelos nuestros como amantes, pacientes y empleados
Google puede conocer ya el estado de ¨¢nimo de su plantilla
Las bases de datos aumentan masivamente hasta convertirse en un pandemonio de millones de entradas. De ese caos, sin embargo, es posible desentra?ar pautas sobre nuestro comportamiento para elaborar modelos predictivos y aplicarlos a la publicidad y al marketing, claro, pero tambi¨¦n a la medicina, la gesti¨®n empresarial, los procesos electorales y la lucha contra el terrorismo. A la b¨²squeda de esas pautas se dedican los expertos en data mining (explotaci¨®n o miner¨ªa de datos), b¨¢sicamente especialistas en estad¨ªstica, matem¨¢ticos e ingenieros inform¨¢ticos, encargados de desbrozar semejantes junglas de archivos en busca de patrones de comportamiento que ayuden a anticipar nuestras decisiones.
"El floreciente mundo de los datos es un laboratorio gigante sobre el comportamiento humano. Es una mesa de operaciones para las ciencias sociales, el comportamiento econ¨®mico y la psicolog¨ªa", escribe Stephen Baker, periodista de BusinessWeek, en el ensayo The Numerati. How they'll get my number and yours (Jonathan Cape). En su libro, Baker aborda el prometedor futuro de la miner¨ªa de datos: "En la d¨¦cada que viene, cada uno de nosotros dar¨¢ lugar, a menudo, sin advertirlo, a modelos propios en casi cada aspecto de la vida. Seremos modelados como trabajadores, pacientes, soldados, amantes, clientes y votantes", escribe. Su vaticinio es ambicioso: sumadas todas estas facetas, veremos la "modelaci¨®n matem¨¢tica de la humanidad".
Una empresa habituada a trabajar con enormes bases de datos, el buscador Google, ya est¨¢ aplicando el data mining en la gesti¨®n de los recursos humanos de su propia plantilla. Ante la marcha de algunos cargos estrat¨¦gicos (ingenieros, dise?adores y ejecutivos de ventas), la compa?¨ªa est¨¢ desarrollando una herramienta que le permitir¨ªa conocer el estado de ¨¢nimo de sus trabajadores y averiguar cu¨¢les se plantean marcharse, seg¨²n public¨® recientemente The Wall Street Journal. Consiste en un algoritmo (una f¨®rmula matem¨¢tica) elaborado a partir de un gran volumen de datos (entrevistas, registros de n¨®minas y ascensos y evaluaciones de compa?eros, etc¨¦tera) de sus 20.000 trabajadores. Google no da muchos detalles m¨¢s, pero el funcionamiento de una herramienta as¨ª es conocido. "Se trata de crear un modelo de predicci¨®n del comportamiento", se?ala Llu¨ªs Belanche, profesor titular del Departamento de Lenguajes y Sistemas Inform¨¢ticos de la Universidad Polit¨¦cnica de Catalu?a.
"Se toma como referencia a los empleados que se fueron de la empresa porque no se sent¨ªan valorados. Cuando se tiene una muestra amplia, de miles, se analiza c¨®mo se comportaron poco antes de marcharse". ?Quiz¨¢ mandaban menos e-mails a tan s¨®lo un reducido grupo de amigos? ?Pasaban m¨¢s tiempo visitando p¨¢ginas web o leyendo la secci¨®n de deportes?, se pregunta Baker, desde Nueva Jersey. "Si existe alguna pauta com¨²n entre estas personas insatisfechas, puedes ense?ar a una m¨¢quina a buscar entre las pautas de la plantilla actual, y localizar a los empleados que encajan en ese perfil". Se trata de proyecciones y no garantizan una fiabilidad del cien por cien, advierte Belanche, "pero cuantos m¨¢s registros se tienen, m¨¢s confianza merece la predicci¨®n".
Las t¨¦cnicas no son nuevas, pero por primera vez se empiezan a aplicar a gran escala a la gesti¨®n de los recursos humanos, la investigaci¨®n m¨¦dica y la lucha contra el terrorismo. "El data mining de Google no es tan diferente de otros an¨¢lisis que hacen las empresas en sus intentos de anticipar nuestro comportamiento", se?ala Baker. "Las compa?¨ªas de m¨®viles, por ejemplo, examinan los patrones de nuestras llamadas en un intento de predecir qui¨¦n es m¨¢s probable que se cambie a otra operadora", a?ade. "Si tus llamadas siguen ese patr¨®n es muy probable que recibas una oferta especial tentadora para que renueves tu contrato".
Las herramientas que procesan tal volumen de datos "son algoritmos de aprendizaje que proceden del campo de la inteligencia artificial", sostiene Fernando Corbacho, socio de operaciones de la compa?¨ªa CognoData, especializada en la aplicaci¨®n de la miner¨ªa de datos en el sector empresarial. "Analizan las bases de datos y aprenden a distinguir entre los clientes que se han ido y los que no. Elaboran un perfil del cliente que se ha ido y luego lo aplica a cada empleado y dice si encaja en el perfil de fuga".
Otros gigantes del sector inform¨¢tico ya estudian c¨®mo optimizar el rendimiento de sus trabajadores. La multinacional IBM se ha fijado en sus especialistas en tecnolog¨ªa. El proyecto consiste en reunir exhaustivos inventarios de las habilidades de cada uno de ellos y luego calcular matem¨¢ticamente la mejor manera de utilizarlos, seg¨²n escribe Baker. Uno de los cerebros de la idea es el matem¨¢tico Samer Takriti, investigador del Thomas J. Watson Research Center de IBM, en Nueva York, que se ha rodeado de un equipo de especialistas, desde data miners y estad¨ªsticos hasta psic¨®logos y antrop¨®logos.
La empresa tiene vedados los archivos de personal, con evaluaciones anuales, pero pr¨¢cticamente todo el resto de informaci¨®n est¨¢ a su disposici¨®n. Y necesitan mucha. Cuanta m¨¢s, mejor. Escudri?ando curr¨ªculos y registros de proyectos, el equipo puede construir un perfil de las habilidades y experiencia de cada trabajador. Puede saber c¨®mo usan su tiempo y con qui¨¦n se re¨²nen a partir de los calendarios online.
Adem¨¢s, en los registros de llamadas y los correos electr¨®nicos est¨¢n grabadas las redes sociales de cada t¨¦cnico. "?A qui¨¦n env¨ªan copias adjuntas de sus e-mails? ?Mandan copias ocultas a alguien? Estos mensajes ocultos podr¨ªan apuntar al crecimiento de redes informales dentro de la compa?¨ªa", incide Baker. "Podr¨ªan mostrar que un cargo medio lidera en silencio a un importante equipo de colegas y que su jefe est¨¢ fuera del circuito. Quiz¨¢ ambos deber¨ªan intercambiar sus puestos". Proyectos como los de Google e IBM est¨¢n a¨²n en fase inicial, pero dejan entrever su alcance potencial.
En Estados Unidos la privacidad de los empleados est¨¢ claramente definida: "El empresario es propietario de cada golpe de tecla y cada clic del rat¨®n y de cada llamada del m¨®vil de la empresa", subraya Baker. "Adem¨¢s pueden estudiar calendarios electr¨®nicos, registros laborales y curr¨ªculos". En Espa?a, una sentencia del Tribunal Supremo de 2007 concluy¨® que los empresarios pueden rastrear toda esa informaci¨®n pero tienen la obligaci¨®n de avisar antes a los empleados de cualquier supervisi¨®n de sus comunicaciones a trav¨¦s de Internet, y deben establecer protocolos.
"Fue una sentencia algo ecl¨¦ctica", se?ala el director de la Agencia Espa?ola de Protecci¨®n de Datos (AEPD), Artemi Rallo. "Se proclam¨® que el tipo de servicios que se ponen a disposici¨®n de los empleados son dignos de protecci¨®n, pero en la misma sentencia se recoge que si el empresario avisa de que podr¨¢ acceder o acceder¨¢ a e-mails e historiales y se protocoliza, la pr¨¢ctica ser¨ªa legal". En cualquier caso -a?ade Rallo-, son situaciones nuevas, sobre las que existe escasa jurisprudencia, y la cobertura legal va avanzando para adaptarse.
Los nuevos expertos en gigantescas bases de datos, los numerati -como los ha bautizado Baker- juegan ya una funci¨®n crucial en las empresas. "Por m¨²ltiples razones", observa Javier Arias, ingeniero de alianzas estrat¨¦gicas de Google en Espa?a. "Para algunas es una herramienta para encontrar nuevas fuentes de beneficios (?qu¨¦ producto tengo que desarrollar/crear), para otras, el data mining es parte de su investigaci¨®n y desarrollo (?qu¨¦ mol¨¦culas tienen m¨¢s probabilidades de funcionar contra un c¨¢ncer espec¨ªfico?)". Y a?ade que las entidades bancarias pueden emplear la t¨¦cnica para "detectar que una operaci¨®n con tarjeta de cr¨¦dito es fraudulenta porque no se corresponde con el patr¨®n de uso normal".
Los usos comerciales del data mining son abundantes. "Los supermercados y las grandes cadenas, como Wal-Mart o Ikea, crean grandes bases de datos en los que cada entrada es, por ejemplo, un tique", indica Belanche. "Saben qu¨¦ has comprado y, si tienes tarjeta de fidelidad, incluso tienen tus datos personales". Es informaci¨®n fundamental para determinar los patrones de compra y poder estimular las ventas. "Localizan por ejemplo dos productos que siempre se compran juntos y los colocan en dos pasillos separados para que tengas que pasar por un tercero y compres otros que no ten¨ªas previsto adquirir".
En la elaboraci¨®n de los modelos de predicci¨®n se emplean desde la estad¨ªstica tradicional hasta las reglas de asociaci¨®n ("si este producto se compra junto a un segundo y un tercero, entonces es probable que se compre este cuarto"), indica Belanche. "Tambi¨¦n los bancos suelen invertir en el desarrollo de sistemas de predicci¨®n de impagos de pr¨¦stamos", prosigue. "Las l¨ªneas a¨¦reas en Internet cuentan con un registro de millones de entradas. Si se analiza el registro de clics se puede saber, por ejemplo, en qu¨¦ momento un cliente ha dejado de comprar un billete y por qu¨¦; quiz¨¢ porque ha recibido un cargo sorpresivo, por ejemplo. A las empresas les interesa saberlo".
E incluso se est¨¢n estudiando aplicaciones en los procesos electorales: conocer el patr¨®n de voto de los electores para poder personalizar el mensaje del candidato. En su ensayo, Baker describe el proyecto de la empresa Spotlight Analysis, dirigida por Josh Gotbaum, ex funcionario de las Administraciones de Carter y Clinton. Se propone localizar a los decisivos swing voters (el voto indeciso que puede resultar determinante en unos comicios) para poder afinar los mensajes electorales. ?La t¨¦cnica? En primer lugar, toman las colosales bases de datos de empresas como ChoicePoint o Acxiom, que acumulan registros sobre sentencias judiciales, transacciones inmobiliarias y de impuestos, y sobre h¨¢bitos de consumo (suscripciones a revistas, compra de libros, viajes, etc¨¦tera). Son compa?¨ªas que "compran cada peque?o dato sobre nosotros que est¨¢ en venta", advierte Baker, "y luego venden selecciones de esos datos a cualquiera que quiera perfilarnos para dirigirnos una campa?a". Luego se cruzan esos registros con los an¨¢lisis sobre las preocupaciones de los consumidores, suministrados por empresas como Yankelovich (que recoge lo que piensan 175 millones de consumidores sobre el ¨¦xito profesional, la vida familiar o su comunidad, entre otros valores). A todo ello se a?ade una serie de encuestas telef¨®nicas. El resultado permite segmentar a los votantes de una manera muy ¨²til para el dise?o de las campa?as electorales. "El tipo de an¨¢lisis estad¨ªstico que discutimos aqu¨ª", precisa Baker, "tanto si se trata de predecir nuestro comportamiento como cazadores de casas o como consumidores de vino, es por naturaleza aproximado. Se basa en la probabilidad". Logran su objetivo "si consiguen respuestas mejores, m¨¢s r¨¢pidas o m¨¢s baratas que las habituales".
El uso de la miner¨ªa de datos en medicina es incipiente pero prometedor. Baker enumera algunos proyectos de instalaci¨®n de sensores en el domicilio de personas de edad avanzada. Recoger¨¢n las pautas de comportamiento y avisar¨¢n de cualquier irregularidad, como un descenso de peso o un cambio del ritmo de los pasos. Otros estudios investigar¨¢n durante las pr¨®ximas d¨¦cadas el desarrollo de nanosensores instalados en el organismo para examinar la sangre y poder alertar a tiempo del crecimiento de un tumor. "Para que funcionen, los numerati tendr¨¢n que desarrollar normas estad¨ªsticas para cientos de nuestras pautas biol¨®gicas".
Con todo, el campo de la miner¨ªa de datos que plantea mayores conflictos sobre la invasi¨®n de la privacidad es el de la lucha contra el terrorismo. Tras los atentados del 11-S de 2001, Washington emple¨® m¨¢s de mil millones de d¨®lares para unir las ingentes bases de datos de la CIA y el FBI y ofrecer as¨ª una ¨²nica fuente a los data miners, seg¨²n explica Baker. Y, adem¨¢s, -enumera el periodista- rastrearon datos de consumo y demograf¨ªa, revisaron registros de l¨ªneas a¨¦reas y recibos de hotel, junto a millones de v¨ªdeos y horas de llamadas telef¨®nicas y tr¨¢fico de internet recopilados por la National Security Agency (NSA). E incluso, seg¨²n publicaron varios medios en 2006, las grandes compa?¨ªas telef¨®nicas entregaron al Gobierno el registro de millones de llamadas.
En esa batalla contra el terror se incluy¨® el software NORA, un sistema para identificar relaciones no evidentes entre tramposos de casinos, seg¨²n detalla Baker. El programa fue ideado para rastrear las bases de datos internas de los casinos en busca de v¨ªnculos entre nombres, direcciones y n¨²meros de tel¨¦fonos.
Tras el 11-S se utiliz¨® NORA para cribar las identidades y movimientos de terroristas. Su creador, Jeff Jonas, es un cient¨ªfico de IBM que aboga por la defensa de los derechos de privacidad. "Necesitaremos tecnolog¨ªa que proteja nuestra identidad y pol¨ªticas que salvaguarden nuestros derechos", advierte en The Numerati. "Vamos a necesitar mucha gente inteligente en pol¨ªtica". Sin una profunda regulaci¨®n -a?ade Baker- es probable que recibamos lo peor de ambos mundos, una sociedad de la vigilancia que aun as¨ª es incapaz de mantenernos seguros.
En cualquier caso, Baker pronostica un inmenso nuevo territorio para la ciencia. "Promete ser uno de los grandes logros del siglo XXI. Su alcance crecer¨¢ hasta incluir la mayor¨ªa del mundo f¨ªsico a medida que los matem¨¢ticos metan mano en nuevos flujos de datos, desde constelaciones de sensores atmosf¨¦ricos hasta la se?al de millones de c¨¢maras de seguridad", vaticina Baker. "Es un mundo paralelo que est¨¢ tomando forma; un laboratorio para la investigaci¨®n y el descubrimiento compuesto de n¨²meros, vectores y algoritmos".

Aplicaciones del 'data mining'
- Comercio. Conocer el patr¨®n de compras del cliente para, por ejemplo, dise?ar mejores campa?as de publicidad y aumentar las ventas.
- Empleo. Cuantificar las habilidades de los trabajadores para aprovecharlas al m¨¢ximo. Localizar trabajadores descontentos.
- Elecciones. Cotejar grandes bases de datos sobre h¨¢bitos de consumo y encuestas para conocer con detalle las inquietudes y los intereses del votante y as¨ª perfilar mejores campa?as.
- Medicina. Reunir grandes bases de datos biol¨®gicos para emplearlas en la detecci¨®n a tiempo de tumores, demencias o alzh¨¦imer.
- Lucha contra el terrorismo. Localizaci¨®n de relaciones, transacciones econ¨®micas y movimientos de sospechosos.
Tu suscripci¨®n se est¨¢ usando en otro dispositivo
?Quieres a?adir otro usuario a tu suscripci¨®n?
Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.
FlechaTu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.
?Tienes una suscripci¨®n de empresa? Accede aqu¨ª para contratar m¨¢s cuentas.
En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.
Archivado En
- AEPD
- Investigaci¨®n m¨¦dica
- Terrorismo internacional
- Ley protecci¨®n datos
- Confidencialidad
- IBM
- Pol¨ªtica antiterrorista
- Lucha antiterrorista
- Comercio electr¨®nico
- Investigaci¨®n cient¨ªfica
- Empleo
- Inform¨¢tica
- Terrorismo
- Comercio
- Medicina
- Empresas
- Internet
- Trabajo
- Telecomunicaciones
- Tecnolog¨ªa
- Econom¨ªa
- Industria
- Pol¨ªtica
- Salud