¡®Big Data¡¯: ?ant¨ªdoto contra la corrupci¨®n?
La toma de decisiones en la esfera p¨²blica puede apoyarse en datos y algoritmos para esquivar arbitrariedades y errores humanos, pero se enfrenta al problema de la privacidad
En los ¨²ltimos a?os hemos presenciado una transici¨®n sin precedentes en nuestra historia: datos de diversa naturaleza sobre el comportamiento humano (qu¨¦ hacemos, d¨®nde vamos, cu¨¢nto gastamos, qu¨¦ consumimos, con qui¨¦n nos comunicamos¡) han pasado de ser un recurso no existente o muy escaso a estar disponibles de manera masiva y en tiempo real. Esta disponibilidad de grandes cantidades de datos (big data) sobre cada uno de nosotros est¨¢ cambiando profundamente el mundo y ha dado lugar a la aparici¨®n de una nueva disciplina llamada Ciencias Sociales Computacionales. Las finanzas, la econom¨ªa, la salud, la medicina, la f¨ªsica, la biolog¨ªa, la pol¨ªtica, el marketing, el periodismo y el urbanismo, entre otras, han experimentado el impacto de este fen¨®meno. El an¨¢lisis de datos agregados sobre el comportamiento humano a gran escala nos abre oportunidades extraordinarias para entender y modelar patrones de conducta, as¨ª como para ayudar en la toma de decisiones, de manera que ya no seamos los humanos quienes decidamos, sino que las decisiones vengan determinadas por algoritmos construidos a partir de esos datos. ?Por qu¨¦ querr¨ªamos que un algoritmo decida?
Esta idea de algoritmos que deciden en lugar de personas puede resultar inquietante. Pero no debemos olvidar que la historia est¨¢ plagada de innumerables ejemplos de sesgos extremos en el proceso de toma de decisiones por humanos ¡ªen particular desde las estructuras de poder en la distribuci¨®n de recursos, la justicia, la igualdad o los bienes p¨²blicos¡ª. Esto ha dado lugar a resultados ineficientes, corruptos, injustos, con graves conflictos de intereses y con consecuencias en muchos casos devastadoras para millones de personas (algunos ejemplos recientes: la crisis econ¨®mica, las hipotecas con cl¨¢usulas suelo, los casos de corrupci¨®n¡). Frente a esto, el desarrollo de algoritmos para la toma de decisiones basados en datos refleja la b¨²squeda de objetividad y la aspiraci¨®n de llegar a decidir bas¨¢ndose en evidencias de manera que se eliminen ¡ªo al menos se minimicen¡ª la discriminaci¨®n, la corrupci¨®n, la injusticia o la ineficiencia de las que, desgraciadamente, no escapan las decisiones humanas. En el contexto del bien social, William Easterly propone el concepto de la ¡°tiran¨ªa de los expertos¡±, seg¨²n el cual economistas, centro de estudios, agencias de ayuda humanitaria, analistas y expertos han dominado proyectos globales de desarrollo econ¨®mico y de reducci¨®n de la pobreza. Como consecuencia de esta ¡°tiran¨ªa¡±, se ha observado que los expertos han favorecido a menudo soluciones tecnocr¨¢ticas que muchas veces no han respetado los derechos individuales de los ciudadanos y no han logrado tener el impacto positivo esperado.
Dado el potencial de los datos, en los ¨²ltimos a?os ha aparecido un f¨¦rtil campo de investigaci¨®n enfocado al desarrollo de f¨®rmulas para la toma de decisiones en el ¨¢rea de las mejoras sociales, es decir, algoritmos que influyen en las decisiones y en la optimizaci¨®n de recursos. Estos algoritmos est¨¢n dise?ados para analizar cantidades ingentes de informaci¨®n de distintas fuentes y, de manera autom¨¢tica, seleccionar los datos relevantes para usarlos de forma concreta. Es lo que se conoce como big data para el bien social. Y en ese campo se han llevado a cabo proyectos que han analizado el valor de los datos para entender el desarrollo econ¨®mico de una regi¨®n, predecir el crimen, modelar la propagaci¨®n de enfermedades infecciosas como la gripe o el ¨¦bola, estimar las emisiones de CO2 o cuantificar el impacto de desastres naturales. Tanto investigadores como Gobiernos, ONG, empresas y grupos de ciudadanos est¨¢n experimentando activamente, innovando y adaptando herramientas de toma de decisiones para alcanzar soluciones que est¨¦n basadas en el an¨¢lisis de informaci¨®n. El potencial es inmenso, y esa es justamente una de las motivaciones de mi trabajo de investigaci¨®n en este ¨¢rea.
Corremos el riesgo de sustituir la ¡®tiran¨ªa de los expertos¡¯ por la ¡®tiran¨ªa de los datos¡¯
Dentro de la comunidad cient¨ªfica tambi¨¦n se han identificado una serie de retos sociales, ¨¦ticos y legales relacionados con la toma de decisiones de manera algor¨ªtmica, que afectan a cuestiones como la privacidad, la seguridad, la transparencia, la ambig¨¹edad con relaci¨®n a la responsabilidad, los sesgos o la discriminaci¨®n. De hecho, en 2014, la Casa Blanca public¨® el informe Big Data: capturando oportunidades, preservando valores, que ?subraya la discriminaci¨®n potencial que pueden contener los datos e identifica ciertos riesgos con relaci¨®n al uso de datos personales para tomar decisiones sobre el cr¨¦dito, la salud o el empleo de las personas. Corremos el riesgo de sustituir la ¡°tiran¨ªa de los expertos¡± por una ¡°tiran¨ªa de los datos¡± si no somos conscientes y tomamos medidas para minimizar o eliminar las limitaciones inherentes en las decisiones basadas en datos.
Para poder aprovechar adecuadamente el potencial de las decisiones basadas en datos y avanzar hacia un mundo m¨¢s justo, honesto e igualitario hay cuatro retos importantes que debemos resolver en el empleo de algoritmos en la toma de decisiones.
El primer escollo es la garant¨ªa de la privacidad de las personas. A medida que los algoritmos tienen acceso a datos procedentes de un n¨²mero creciente de fuentes, incluso cuando dichos datos son an¨®nimos, de su cruce y combinaci¨®n podr¨ªan inferirse ciertas caracter¨ªsticas sobre una persona en particular, aunque esta informaci¨®n nunca haya sido desvelada por la misma, como ilustra el trabajo de Yves Alexandre de Montjoye. Afortunadamente, pueden tomarse medidas para minimizar o eliminar este impacto en la privacidad, como la agregaci¨®n de datos an¨®nimos.
Las conclusiones a las que podemos llegar son clave para afrontar los grandes retos de nuestra especie
Otro reto es la asimetr¨ªa en el acceso a la informaci¨®n. Podr¨ªamos llegar a una situaci¨®n en la que una minor¨ªa tiene acceso a datos y dispone del conocimiento y las herramientas necesarias para analizarlos, mientras que una mayor¨ªa no. Esta situaci¨®n exacerbar¨ªa la asimetr¨ªa ya existente en la distribuci¨®n del poder entre los Gobiernos o las empresas, de una parte, y las personas, de otra. Iniciativas para promover datos abiertos (open data) y programas de educaci¨®n que fomenten la alfabetizaci¨®n digital y el an¨¢lisis de datos son dos ejemplos de medidas que se podr¨ªan desarrollar para mitigar esto.
El tercer punto controvertido es la opacidad de los algoritmos. Jenna Burrell habla de un marco que caracteriza la opacidad de los algoritmos en tres tipos: 1) opacidad intencionada, donde el objetivo es la protecci¨®n de la propiedad intelectual; 2) opacidad por ignorancia, porque la mayor¨ªa de los ciudadanos carecen del conocimiento t¨¦cnico para entender los algoritmos de inteligencia artificial subyacentes; y 3) opacidad intr¨ªnseca, resultado de la naturaleza de las operaciones matem¨¢ticas utilizadas, que en muchas ocasiones son muy dif¨ªciles o imposibles de interpretar. Estos tipos de opacidad pueden minimizarse con la introducci¨®n de legislaci¨®n que obligue al uso de sistemas abiertos, con programas educativos en pensamiento computacional, con iniciativas para explicar a ciudadanos sin conocimientos t¨¦cnicos c¨®mo funcionan los algoritmos de toma de decisiones y con el uso de modelos de inteligencia artificial que sean f¨¢cilmente interpretables, aunque satisfacer tal condici¨®n implique utilizar modelos m¨¢s sencillos u obtener resultados menores si se comparan con los obtenidos con modelos tipo caja negra.
Cifras que generamos: Cada d¨ªa se crean 2,5 trillones de bytes de datos, seg¨²n un estudio de IBM del a?o 2012
El ¨²ltimo reto es la exclusi¨®n social y la discriminaci¨®n en potencia que podr¨ªan resultar de las decisiones tomadas por algoritmos basados en datos. Los motivos pueden ser m¨²ltiples: en primer lugar, los datos que se utilicen pueden contener sesgos que queden plasmados en dichos algoritmos; adem¨¢s, si no se utilizan los modelos correctamente, los resultados podr¨ªan ser discriminatorios ¡ªesto ha quedado demostrado en el reciente trabajo de Toon Calders e Indr ?liobait?¡ª. Otro riesgo es que a ciertos individuos se les denieguen oportunidades debido no a sus propias acciones, sino a acciones de otras personas con las que comparten algunas caracter¨ªsticas. Por ejemplo, algunas empresas de tarjetas de cr¨¦dito han reducido los l¨ªmites de cr¨¦dito de clientes no bas¨¢ndose en su propio historial financiero, sino a partir del an¨¢lisis de datos de otros clientes con un historial financiero muy deficiente, pero que hab¨ªan comprado en las mismas tiendas donde hab¨ªan consumido los clientes castigados, como refleja un informe de la Federal Trade Commission en EE UU. Por esto es de vital importancia conocer bien tanto las virtudes como los problemas de los datos y de los modelos utilizados, y llevar a cabo los an¨¢lisis necesarios para identificar y cuantificar las posibles limitaciones.
Afortunadamente, estos retos no son insalvables. El potencial de los datos para ayudar a mejorar el mundo es inmenso en numerosas ¨¢reas, incluyendo la salud p¨²blica, la respuesta ante desastres naturales y situaciones de crisis, la seguridad ciudadana, el calentamiento global, la educaci¨®n, la planificaci¨®n urbana, el desarrollo econ¨®mico o la elaboraci¨®n de estad¨ªsticas. De hecho, el uso del big data es un elemento central en los 17 Objetivos para el Desarrollo Sostenible (SDG) de Naciones Unidas: los datos ¡ªy las conclusiones a las que podemos llegar gracias a su an¨¢lisis¡ª son y ser¨¢n un elemento clave para ayudarnos a abordar los grandes retos a los que nos enfrentamos como especie.
Bien usados, los datos ofrecen la oportunidad de democratizar ciertas decisiones, superando la ¡°tiran¨ªa de expertos¡± mencionada anteriormente y consiguiendo que las decisiones respondan a variables menos sujetas a la arbitrariedad de unos pocos. Pero tambi¨¦n debemos encontrar un equilibrio y asumir la responsabilidad de no caer en una ¡°tiran¨ªa de datos¡±. Solo desde un compromiso colectivo que implique tanto a investigadores, pol¨ªticos y otros agentes sociales como a los ciudadanos ¡ªa cualquiera que pueda estar leyendo este art¨ªculo¡ª podremos explorar y aprovechar las posibilidades potenciales que los datos ofrecen para la consecuci¨®n del bien com¨²n, el nuestro y el de generaciones futuras. Tenemos una oportunidad que no debemos ¡ªni podemos¡ª dejar pasar.
Nuria Oliver es experta en inteligencia artificial y ¡®big data¡¯, coautora del informe ¡®The Tyranny of Data? The Bright and Dark Sides of Data-Driven Decision-Making for Social Good¡¯.
Tu suscripci¨®n se est¨¢ usando en otro dispositivo
?Quieres a?adir otro usuario a tu suscripci¨®n?
Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.
FlechaTu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.
En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.