O¨ªmos mucho hablar de las ¡®cookies¡¯ inform¨¢ticas, ?pero sabemos c¨®mo funcionan?
La capacidad de estos archivos para monitorizar nuestra actividad en la red reside en que, cada vez que yo regrese a una p¨¢gina, mi navegador le enviar¨¢ todas las que esa web me dej¨® anteriormente
Todos hemos escuchado hablar de las cookies inform¨¢ticas. Algunos incluso saben que son muy importantes a la hora de facilitar la navegaci¨®n del usuario, al permitir una carga m¨¢s r¨¢pida de las p¨¢ginas, y en la publicidad digital personalizada. ?Pero sabemos c¨®mo funcionan?
Cuando uno se conecta a una p¨¢gina web, el navegador del usuario env¨ªa una petici¨®n a un ordenador remoto, llamado servidor, que le env¨ªa la respuesta de ...
Todos hemos escuchado hablar de las cookies inform¨¢ticas. Algunos incluso saben que son muy importantes a la hora de facilitar la navegaci¨®n del usuario, al permitir una carga m¨¢s r¨¢pida de las p¨¢ginas, y en la publicidad digital personalizada. ?Pero sabemos c¨®mo funcionan?
Cuando uno se conecta a una p¨¢gina web, el navegador del usuario env¨ªa una petici¨®n a un ordenador remoto, llamado servidor, que le env¨ªa la respuesta de vuelta. As¨ª, usar nuestro tel¨¦fono para leer las entradas de Cr¨®nicas del Intangible supone que el navegador de nuestro m¨®vil inicie una comunicaci¨®n con el servidor de elpais.com. Si todo va bien, elpais.com responder¨¢ diciendo OK, aqu¨ª va la p¨¢gina que me has solicitado. El navegador, entonces, recibe una cierta cantidad de informaci¨®n separada en dos partes: por un lado, el cuerpo de la respuesta, que lleva los datos que forman parte del contenido que se mostrar¨¢ al usuario; por otro, una secci¨®n con cabeceras de la respuesta, que contiene datos no visuales (aspectos que el lector no ve reflejada en la p¨¢gina, pero que son importantes para las m¨¢quinas). Algunos de ellos son imprescindibles para que la comunicaci¨®n tenga ¨¦xito.
Al solicitar a un servidor la lectura de una p¨¢gina web, el cuerpo de la petici¨®n es texto en un formato llamado HTML. El texto en HTML incluye el propio texto que se quiere mostrar y, adem¨¢s, lleva marcas de formato, que le dicen al navegador: ¡°Este texto va en negrita, este otro en cursiva, aqu¨ª has de colocar una imagen¡±.
Pero, para que el navegador sepa que lo que se le est¨¢ entregando es HTML y pueda dibujarlo como tal, con sus cursivas y negritas, el servidor le env¨ªa al navegador, en la secci¨®n de cabeceras, informaci¨®n acerca del tipo de contenido que se le est¨¢ enviando: ¡°Oye, ojo, que lo que te estoy enviando en el cuerpo es texto en HTML¡±.
A veces, junto a las negritas, las cursivas y muchas otras marcas de formato, al navegador se le dice que en cierto lugar va una imagen o, incluso, un peque?o programa que el navegador puede interpretar y ejecutar y con el que podemos resolver el crucigrama de Mambrino (in memoriam) que, desde hace poco, se publica en la web de este diario. La imagen puede ir incrustada en el propio texto HTML; pero, en otras, la imagen no se le env¨ªa directamente, sino que el servidor le env¨ªa al navegador una direcci¨®n de Internet a la que el navegador debe pedir la imagen que va en ese sitio. Esta direcci¨®n de Internet puede estar en el mismo servidor que en la petici¨®n original (elpais.com, en nuestro ejemplo) o puede estar en otro.
En cualquier caso, el navegador env¨ªa una nueva petici¨®n al servidor que se le ha indicado para descargarse la imagen: el servidor se la enviar¨¢ en el cuerpo de la respuesta y, en la secci¨®n de cabeceras, el servidor le indica al navegador que la informaci¨®n que viaja en el cuerpo es una imagen en JPG, PNG, un v¨ªdeo, un audio o un programa. De este modo, con esa informaci¨®n no visual que se incluye en las cabeceras, el navegador sabe c¨®mo tratar la informaci¨®n que le est¨¢ llegando, dibuj¨¢ndola o escribi¨¦ndola adecuadamente, o ejecutando alguna instrucci¨®n que me dice que he completado correctamente el crucigrama.
As¨ª, la carga de una ¨²nica p¨¢gina como la de elpais.com supone en realidad que nuestro navegador env¨ªe muchas, much¨ªsimas peticiones al servidor: una para el texto, una para cada imagen que encontremos, otra para cada v¨ªdeo, otra para cada anuncio, etc¨¦tera.
Adem¨¢s del tipo de contenido, en la secci¨®n de cabeceras que contiene las respuestas a las peticiones, el servidor puede colocar informaci¨®n adicional, por ejemplo, una o m¨¢s cookies, las conocidas galletitas inform¨¢ticas con la informaci¨®n que el servidor decida. En la ilustraci¨®n anterior aparecen algunas de las cookies que me ha dejado elpais.com cuando me he conectado a su p¨¢gina principal. Cada una tiene, entre otras propiedades, un nombre (name), un valor (value) y una fecha de expiraci¨®n (Max-Age). La capacidad de las cookies para monitorizar nuestra actividad en la red reside en que, cada vez que yo regrese a elpais.com, mi navegador le enviar¨¢ todas las cookies que el propio elpais.com me dej¨® anteriormente. Por ejemplo, la ¨²ltima cookie que aparece en la figura se llama _chartbeat2, su valor empieza por .1626 y caduca el 1 de agosto de 2022. Si ma?ana, como es habitual, regreso a la p¨¢gina principal o visito cualquier otra p¨¢gina del mismo servidor, mi navegador enviar¨¢ al servidor el nombre y valor de esta cookie, lo cual permitir¨¢ al servidor saber que soy la misma persona que ayer estuvo aqu¨ª.
Observe el lector en la parte izquierda de la figura que muchos otros servidores me han dejado tambi¨¦n cookies: todas ellas proceden de la misma petici¨®n de datos a elpais.com. Y es que, cuando nuestro navegador va interpretando y mostrando la respuesta que recibe, env¨ªa otras peticiones a otros servidores para descargarse, dec¨ªamos antes, im¨¢genes, v¨ªdeos o anuncios.
As¨ª, la petici¨®n de lectura de la p¨¢gina principal de este diario ha enviado en alg¨²n momento una petici¨®n al segundo servidor que aparece en la parte izquierda de la figura, identificado como googleads.g.doubleclik.net. Este servidor nos ha dejado dos cookies: DSID (cuyo valor es NO_DATA) e IDE (con valor AHWq...).
Si, acto seguido, visito un diario de la competencia, estar¨¦ iniciando una comunicaci¨®n con su servidor para recuperar su p¨¢gina principal. El procesamiento de la respuesta es similar: m¨²ltiples peticiones a diversos servidores para recuperar texto, fotos, v¨ªdeos, anuncios... Y, si alguna de estas m¨²ltiples peticiones se env¨ªa a googleads.g.doubleclik.net, el valor de las cookies que este servidor me dej¨® al visitar EL PA?S viajar¨¢n de nuevo a este servidor publicitario, de modo y manera que googleads.g.doubleclik.net sabr¨¢ que, aunque ahora est¨¦ leyendo el ABC, acabo de venir de leer EL PA?S.
Quiz¨¢s el hecho de que estos sistemas conozcan esta informaci¨®n no sea demasiado importante, pues revela sobre nosotros lo mismo que sabe el camarero del bar en el que desayunamos, que conoce nuestros horarios y ve a diario c¨®mo vamos cogiendo, de encima de la barra, el peri¨®dico local o el nacional y sabe si nos detenemos en la secci¨®n de Opini¨®n, de Sociedad o de Deportes.
La amenaza a nuestra intimidad aparece cuando se relacionan estos datos de navegaci¨®n con otros personales: si relleno un formulario con mi nombre, correo, mi domicilio, doubleclick.net sabr¨¢ que quien lee esos peri¨®dicos es Macario, que no le interesa el deporte porque apenas visita esas p¨¢ginas, pero que, sin embargo, responde correctamente SAL a las tres letras horizontales de La pide el huevo. Sabr¨¢ tambi¨¦n, y no solo por los datos del formulario, sino por la posibilidad de geolocalizar una IP con cierta precisi¨®n, que habitualmente me encuentro en Ciudad Real. Pero adem¨¢s, si en cualquier p¨¢gina de las que se conecta a doubleclick.net (y son much¨ªsimas) acepto por descuido el permiso de compartir mi ubicaci¨®n, conocer¨¢ con exactitud las coordenadas de mi domicilio y de mi trabajo.
Aceptar las cookies sin leer su pol¨ªtica ni personalizarlas nos expone a que estos sistemas externos nos conozcan y nos clasifiquen, pues producimos al navegar una cantidad ingente de informaci¨®n con la que se nos coloca en determinados grupos de internautas.
?Y si no hubiera cookies? Los programitas como el de los pasatiempos, que nuestro navegador descarga y ejecuta, pueden tambi¨¦n acceder a mucha informaci¨®n de nuestro equipo, que puede enviarse al servidor sin nuestro conocimiento. Adem¨¢s de la marca y versi¨®n del navegador, de nuestro idioma, de nuestra IP, puede viajar la resoluci¨®n de nuestra pantalla, el tipo de letra que usamos en nuestro equipo, las sesiones que tenemos abiertas en redes sociales... Los valores de estos y otros par¨¢metros conforman nuestra huella digital, que permite identificarnos con una precisi¨®n muy alta.
Tambi¨¦n est¨¢ la posibilidad ir disfrazados al bar, con gabardina y sombrero y un postizo de bigote y gafas. Cuando lleguemos, el camarero nos dar¨¢ El Pa¨ªs y nos preguntar¨¢ que si queremos lo de siempre.
Macario Polo Usaola es catedr¨¢tico de la Universidad de Castilla-La Mancha.
Cr¨®nicas del Intangible es un espacio de divulgaci¨®n sobre las ciencias de la computaci¨®n, coordinado por la sociedad acad¨¦mica SISTEDES (Sociedad de Ingenier¨ªa de Software y de Tecnolog¨ªas de Desarrollo de Software). El intangible es la parte no material de los sistemas inform¨¢ticos (es decir, el software), y aqu¨ª se relatan su historia y su devenir. Los autores son profesores de las universidades espa?olas, coordinados por Ricardo Pe?a Mar¨ª (catedr¨¢tico de la Universidad Complutense de Madrid) y Macario Polo Usaola (profesor titular de la Universidad de Castilla-La Mancha).
Para consultar las cr¨®nicas de otros a?os, haga clic aqu¨ª.
Puedes seguir a EL PA?S TECNOLOG?A en Facebook y Twitter o apuntarte aqu¨ª para recibir nuestra newsletter semanal.