La otra cara del Big Data
En la era del algoritmo muchas de las decisiones cotidianas las toma un modelo matem¨¢tico
Vivimos en la era del algoritmo. Muchas decisiones sobre nuestra actividad cotidiana (la cuota mensual que pagamos por un seguro m¨¦dico, la selecci¨®n de nuestro CV para una entrevista de trabajo, o la aceptaci¨®n o rechazo de un cr¨¦dito) no las toma ya un humano sino un modelo matem¨¢tico. Y aunque, en teor¨ªa, esto deber¨ªa conducir a una mayor igualdad ya que todo el mundo es juzgado en base a los mismos criterios, muchas veces ocurre lo contrario: los modelos son opacos, no est¨¢n sujetos a regulaci¨®n, con frecuencia est¨¢n basados en hip¨®tesis err¨®neas y refuerzan pr¨¢cticas discriminatorias con los sectores m¨¢s d¨¦biles de la sociedad. Esta marginaci¨®n ha existido siempre, en la era digital simplemente se puede implementar de manera m¨¢s eficiente e impersonal. Esta es la visi¨®n del reciente libro de Cathy O'Neill, Weapons of math destruction.
La prima mayor est¨¢ justificada por un mayor riesgo, estimado sobre datos anteriores de personas con caracter¨ªsticas similares
Las empresas de seguros usan complejos modelos para fijar la prima de un seguro en funci¨®n de las caracter¨ªsticas del solicitante: una persona m¨¢s mayor pagar¨¢ m¨¢s seguro de salud, y un conductor con poca experiencia m¨¢s seguro de autom¨®vil. En ambos casos, la prima mayor est¨¢ justificada por un mayor riesgo, estimado sobre datos anteriores de personas con caracter¨ªsticas similares. Pero los datos tambi¨¦n muestran que las personas de renta m¨¢s baja tienen mayor riesgo de enfermedad, ?es l¨ªcito cobrarles una prima m¨¢s alta? Para el modelo matem¨¢tico, ¡°edad¡± ¨® ¡°nivel de renta¡± son variables predictoras que se tratan por igual para afinar y mejorar la predicci¨®n. Sin embargo, la ¨¦tica obliga a poner l¨ªmites a la eficiencia de dichos algoritmos, y condiciona por ejemplo qu¨¦ variables son susceptibles de ser utilizadas. Con frecuencia los modelos utilizan proxys: variables supuestamente correlacionadas con otras de las que no disponen de informaci¨®n suficiente. Por ejemplo, usar el c¨®digo postal como proxy del nivel de renta. El abuso de esta pr¨¢ctica produce modelos estad¨ªsticos cuyos datos de aprendizaje son poco m¨¢s que ruido, y conducen a predicciones err¨®neas. C¨®mo dicen en la jerga: si metes basura, sacas basura.
El Proyecto para la transparencia de la web, desarrollado por la Universidad de Princeton, es una iniciativa para detectar este tipo de modelos discriminatorios, evaluando c¨®mo las compa?¨ªas utilizan los datos de consumidores, garantizando la privacidad y la ¨¦tica en su uso.
Compartir datos es necesario para el desarrollo de muchas aplicaciones beneficiosas y permite una gesti¨®n m¨¢s eficiente de los recursos comunes
Compartir datos es necesario para el desarrollo de muchas aplicaciones beneficiosas y no s¨®lo permite una gesti¨®n m¨¢s eficiente de los recursos comunes sino que hace avanzar la investigaci¨®n biom¨¦dica. Por eso, es importante garantizar que las bases de datos que se hacen p¨²blicas sean anonimizadas de manera robusta, es decir, que no sea posible la identificaci¨®n de un individuo con informaci¨®n parcial. Muchas bases de datos en el ¨¢mbito de las comunicaciones y las finanzas se han demostrado vulnerables en este sentido, y permiten por ejemplo averiguar el domicilio de una persona simplemente a partir de una foto en la que se la vea salir de un taxi.
Las grandes corporaciones recopilan datos de sus usuarios de manera masiva, lo que las coloca en una situaci¨®n inmensamente privilegiada frente al resto de la sociedad. Una peque?a modificaci¨®n del algoritmo de Facebook que selecciona los mensajes que aparecen en el muro permiti¨® demostrar que la red social puede propagar estados de ¨¢nimo en una poblaci¨®n. El experimento recibi¨® duras cr¨ªticas por no contar con la autorizaci¨®n de los usuarios, pero revel¨® el inmenso poder de los algoritmos en la red social, que f¨¢cilmente podr¨ªan influenciar el resultado de unas elecciones.
Una peque?a modificaci¨®n del algoritmo de Facebook permiti¨® demostrar que la red social puede propagar estados de ¨¢nimo en una poblaci¨®n
Frente a esta visi¨®n de pr¨¢cticas abusivas, existen proyectos que promueven el uso del Big Data para el bien com¨²n. El proyecto Open Algorithms, liderado por Alex Pentland, del MIT Media Lab, propone nuevas formas de intercambio de informaci¨®n para garantizar la privacidad de los datos personales, a la par que permitir el funcionamiento seguro de aplicaciones colaborativas con datos compartidos. Adem¨¢s, insiste en que los algoritmos matem¨¢ticos que traten con estos datos sean p¨²blicos y auditables.
La sociedad ha de ser consciente del creciente papel que juegan estos modelos matem¨¢ticos en la toma de decisiones. Aunque no todo el mundo pueda tener los conocimientos t¨¦cnicos para entender su funcionamiento en detalle, es deseable que una amplia mayor¨ªa no s¨®lo sea capaz de manejar aplicaciones con datos para su uso personal, sino que entienda sus implicaciones en un contexto m¨¢s amplio. Adem¨¢s, las autoridades competentes han de crear mecanismos de auditor¨ªa para garantizar la transparencia en el funcionamiento de dichas herramientas.
David G¨®mez-Ullate es coordinador del laboratorio de ciencia de datos en el Instituto de Ciencias Matem¨¢ticas y Profesor Titular de Matem¨¢tica Aplicada en la Universidad Complutense.
Caf¨¦ y Teoremas es una secci¨®n dedicada a las matem¨¢ticas y al entorno en el que se crean, coordinado por el Instituto de Ciencias Matem¨¢ticas (ICMAT), en la que los investigadores y miembros del centro describen los ¨²ltimos avances de esta disciplina, comparten puntos de encuentro entre las matem¨¢ticas y otras expresiones sociales y culturales, y recuerdan a quienes marcaron su desarrollo y supieron transformar caf¨¦ en teoremas. El nombre evoca la definici¨®n del matem¨¢tico h¨²ngaro Alfred R¨¦nyi: ¡°Un matem¨¢tico es una m¨¢quina que transforma caf¨¦ en teoremas¡±.
Tu suscripci¨®n se est¨¢ usando en otro dispositivo
?Quieres a?adir otro usuario a tu suscripci¨®n?
Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.
FlechaTu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.
En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.