La compra de datos del INE a las compa?¨ªas telef¨®nicas es, en realidad, una buena noticia
La controversia surgida que nos debe ayudar a poner en valor el trabajo en el ¨¢rea big data realizada por una administraci¨®n p¨²blica como el INE
Hace d¨ªas supimos que el Instituto Nacional de Estad¨ªstica (INE) seguir¨¢ la pista de los m¨®viles en territorio nacional para elaborar estad¨ªsticas y que, para ello, se apoyar¨¢ en datos comprados a las principales operadoras telef¨®nicas. Desde entonces han surgido noticias, art¨ªculos de opini¨®n y comentarios en redes sociales comentando la informaci¨®n sobe todo haciendo referencia a la cesi¨®n de datos y, por tanto, a la salvaguardia de la privacidad de los titulares de l¨ªneas de m¨®viles.
Esta pol¨¦mica trae a primera l¨ªnea dos hechos muy relevantes y positivos. Primero, la magn¨ªfica labor realizada por el INE y segundo, la concienciaci¨®n general sobre los datos personales y de c¨®mo la privacidad realmente nos importa.
Es un verdadero lujo pensar que la principal instituci¨®n p¨²blica para la elaboraci¨®n de estad¨ªsticas est¨¦ invirtiendo en la ampliaci¨®n de los datos a explorar, y en particular, es esta tipolog¨ªa de datos, cuya granularidad, volumen y tecnolog¨ªa requerida para su explotaci¨®n la hacen ser una fuente propia del entorno big data. Este caso ser¨¢ una verdadera best practice (que tanto nos gusta denominar en el sector privado) de esta nueva era de datificaci¨®n en la que nos encontramos.
Adem¨¢s, no es un estudio puntual, aislado, sino englobado en el marco de actuaci¨®n de la mayor operaci¨®n estad¨ªstica que se aborda en este pa¨ªs: el censo de poblaci¨®n y viviendas de 2021. Este ser¨¢ el primer censo en el que no se entreviste a las personas, ni presencialmente ni mediante cuestionario alguno. Este tipo de nuevas fuentes de datos, junto al avance de otros registros administrativos (padr¨®n continuo, catastro, etc.) posibilitan esta nueva aproximaci¨®n, realizada por muy pocos otros pa¨ªses. Por cierto, toda esta aproximaci¨®n metodol¨®gica viene siendo transmitida y difundida p¨²blicamente desde hace varios meses en el marco del pre-proyecto censal.
Por tanto, debemos considerar como normal y estrat¨¦gicamente acertado una licitaci¨®n p¨²blica para disponer de estos datos, fomentando la Econom¨ªa del Conocimiento y revertiendo esta inversi¨®n en la estad¨ªstica?p¨²blica.
Pero es que, adem¨¢s de estos datos sobre movilidad cotidiana de la poblaci¨®n con datos procedentes de telefon¨ªa m¨®vil, el INE ya est¨¢ trabajando, para diferentes fines, en la explotaci¨®n de otras fuentes de datos, como los procedentes de las principales cadenas de distribuci¨®n, o datos generados a trav¨¦s de t¨¦cnicas de web scrapping.?
Y llegamos entonces a ese segundo hecho relevante que ya adelant¨¢bamos, la privacidad. Por ser transparentes algunos de los titulares publicados en los medios creo que no han ayudado a la mejor de las comprensiones del proyecto, gener¨¢ndose multitud de opiniones en contra por la utilizaci¨®n de datos personales. Pero lo dicho, parece un signo de madurez las cuestiones que nos planteamos cuando conocemos proyectos de esta ¨ªndole, y transmitimos el valor que realmente tienen todos y cada uno de los datos que hablan de nosotros, y que ata?en a nuestra privacidad.
Y es que el INE no va a trabajar con datos personales, y s¨ª son datos estad¨ªsticos, es decir, datos consolidados de ¨¢reas geogr¨¢ficas lo suficientemente peque?as para aportar variabilidad (informaci¨®n) a su estudio y por otro lado para salvaguardar el anonimato de cada una de las observaciones (datos individuales) utilizados.
Es decir, el marco regulatorio actual (GDPR) no parece de aplicaci¨®n en tanto que la informaci¨®n no guarda relaci¨®n con una persona f¨ªsica identificada o identificable. Las t¨¦cnicas anal¨ªticas actuales sobre anonimizaci¨®n de datos, de car¨¢cter irreversible para no permitir que la identidad sea deducida, nos hacen confiar en que los datos van a fluir entre los operadores m¨®viles y la Administraci¨®n asegur¨¢ndose la privacidad de los mismos (ver recomendaci¨®n al respecto de la Agencia Espa?ola Protecci¨®n Datos.?
Estos datos de los que venimos hablando, no son, en definitiva, m¨¢s que uno de los numerosos ejemplos de datasets que se vienen comercializando desde diferentes tipos de empresas, y que forman esta nueva l¨ªnea de negocio, evidente y l¨®gica, alrededor de la monetizaci¨®n de este valor intangible y diferencial que son los datos. Por ello, es ah¨ª donde los diferentes organismos regulatorios deben hacer valer sus competencias y velar por el cumplimiento de la actual legislaci¨®n, en lo referente al tratamiento adecuado de los mismos.
Y si adem¨¢s, como clientes, nos surge la duda de por qu¨¦, si es el caso, se estuvieran comercializando nuestros datos para otros fines no vinculados al fin principal, debemos plantear la duda al titular de los mismos (en el caso que nos ocupa, dos de las tres operadores ofrecen la posibilidad de exclusi¨®n de los datos, y una tercera justifica que no est¨¢n liberando datos personales, y s¨ª datos estad¨ªsticos).
En definitiva, controversia la surgida que nos debe ayudar a poner en valor el trabajo en el ¨¢rea big data realizada por una administraci¨®n p¨²blica como el INE, utilizando nuevas fuentes de informaci¨®n, as¨ª como la puesta de manifiesto de la preocupaci¨®n que tenemos por la privacidad de nuestros datos personales, y que debemos hacer significar no solo si el ¨²ltimo responsable de tratamiento es el INE, si no tambi¨¦n Google, Facebook u otras empresas de esta nueva econom¨ªa digital.?
Daniel Ruiz Nodar es licenciado en Ciencias Matem¨¢ticas, profesor de Estad¨ªstica en la Universitat Oberta de Catalunya (UOC) y Chief Data Officer (CDO)en Equifax Ib¨¦rica.
Tu suscripci¨®n se est¨¢ usando en otro dispositivo
?Quieres a?adir otro usuario a tu suscripci¨®n?
Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.
FlechaTu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.
En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.