Todo lo que necesitas saber sobre la conquista del dato
El mar de datos es inmenso y ca¨®tico, pero navegarlo es cuesti¨®n de astucia al tim¨®n. Ya hay una cantidad casi infinita de informaci¨®n, el problema ahora es que se desborda. Industrias y gobiernos ponen el foco en c¨®mo gestionarla.
Un futuro en el que cada empleado sea su propio jefe, en el que la pol¨ªtica de empleo una al parado con la empresa que necesita de sus cualidades y en el que las variables a la hora de acometer una obra fara¨®nica se resuelvan con sencillez. El big data es una chistera de la que pueden sacarse infinitos conejos. Pero, como todo truco de magia, es fr¨¢gil y arduo de ejecutar. La conversaci¨®n sobre este paradigma tecnol¨®gico, del que numerosos analistas esperan un valor global de 200 millones de euros para 2020, ha cambiado radicalmente. Greg DeMichillie, director de producto de Google Cloud y ex de Amazon y Adobe, ha vivido esta transformaci¨®n muy de cerca: ¡°Ha habido un gran cambio en los ¨²ltimos cinco o diez a?os. El problema al que se enfrentaban las compa?¨ªas era que no pod¨ªan permitirse econ¨®micamente almacenar todos sus datos. Se ve¨ªan forzadas a elegir qu¨¦ conservar y qu¨¦ eliminar. Hoy eso se ha acabado; cualquier empresa puede permitirse almacenar el hist¨®rico completo de sus operaciones en la nube. Ahora el reto es encontrar, por as¨ª decirlo, las agujas de valor en estos pajares de informaci¨®n¡±.
La pregunta fundamental es c¨®mo puede usarse esta tecnolog¨ªa
m¨¢s all¨¢ de las grandes empresas.
Esas agujas pueden tener tanta importancia como fijar el rumbo pol¨ªtico de la naci¨®n m¨¢s poderosa del mundo. Rayid Ghani, director del Centro para la Ciencia de los Datos y las Pol¨ªticas P¨²blicas de la Universidad de Chicago, tuvo exactamente ese trabajo como jefe cient¨ªfico de la campa?a para la reelecci¨®n de Obama como presidente de Estados Unidos. Su oc¨¦ano de datos, los casi 66 millones de electores que votaron en los comicios. Pero no todos val¨ªan lo mismo.
La utilidad electoral
¡°Las inc¨®gnitas que necesitas despejar para ganar unas elecciones son muy simples. Para cada votante debes descubrir dos cosas: ?Te apoya o no? ?Votar¨¢ o no?¡±. Estas dos reglas despliegan la hidra de millones de cabezas que es enfrentarse a un censo electoral tan inmenso como el de Estados Unidos. Ghani explica c¨®mo evaluar estas dos variables con una puntuaci¨®n de 0 a 100 y las decisiones que hay que tomar, votante a votante, seg¨²n la puntuaci¨®n que saque. A los extremos, por ejemplo, no merece la pena dedicarles recursos econ¨®micos. ¡°?Para qu¨¦ vas a gastar dinero en el que va a votar seguro y te apoya o en el que no te apoya y no va a votar seguro? El gasto tiene que hacerse en los que se encuentran en valores intermedios¡±. Sin embargo, los que sacan valores casi perfectos, cercanos al doble cien, son esenciales. ¡°Les puedes pedir que participen como voluntarios, que contribuyan a financiar la campa?a o que simplemente difundan el entusiasmo por tu candidato entre sus amigos¡±.
El arte de la evaluaci¨®n de los datos, como apunta Ghani, llega en el amplio n¨²mero de votantes inc¨®gnita. Para despejar esta duda, este experto indica que se acude al registro hist¨®rico. ¡°Es especialmente complejo porque las elecciones suceden cada cuatro a?os, as¨ª que te puedes equivocar. Pero b¨¢sicamente lo que hacemos es apoyarnos en c¨®mo se evalu¨® a tales votantes de tal zona y en si esa evaluaci¨®n se demostr¨® correcta o incorrecta el d¨ªa de las elecciones¡±.
Ghani subraya cu¨¢n importante es ser lo m¨¢s fino posible en esta evaluaci¨®n porque los recursos de una campa?a son limitados. ¡°Seg¨²n el grado de ¨¦xito que calcules a priori has de elegir si te merece la pena un contacto por red social, una llamada telef¨®nica o personarte en el hogar de ese votante para intentar convencerle de que te vote¡±. Estas predicciones se pueden reajustar sobre la marcha porque en algunos Estados se permite la votaci¨®n anticipada, lo que posibilita que el modelo alimente sus poderes de or¨¢culo teniendo en cuenta el comportamiento de estos votantes madrugadores.
La obsesi¨®n actual de Ghani y de otros acad¨¦micos no se dirige, sin embargo, a sus usos electorales. Apunta a c¨®mo los gobiernos de todo el planeta pueden desplegar esta tecnolog¨ªa para ser m¨¢s eficientes. A lograr que las soluciones tecnol¨®gicas ya posibles se integren con administraciones poco acostumbradas o directamente desconocedoras de ellas. Salud. Transporte. Educaci¨®n. Agricultura. Pobreza. Empleo. Todas las ¨¢reas de inter¨¦s que competen a un Gobierno se pueden beneficiar de la aplicaci¨®n inteligente del big data. Y en todas ellas la filosof¨ªa subyacente se resume en una sencilla frase: ¡°Saber ad¨®nde debe ir el dinero y por qu¨¦¡±.
El dato en Telef¨®nica
El big data aspira a dar m¨¢s libertad para la toma de decisiones a cada departamento y Telef¨®nica ha planteado una revoluci¨®n interna para ello, con los sistemas Joyas y Aura. A cambio, los departamentos deben estructurar la informaci¨®n seg¨²n nuevos est¨¢ndares de sem¨¢ntica interna. "Somos una compa?¨ªa con mucho legacy, tenemos datos de los 70 y 80 sin estructurar, y hemos crecido con adquisiciones de otras compa?¨ªas, cada una con su pol¨ªtica de datos. Ofrecer este sistema a las unidades de negocio a cambio de homogeneizar la informaci¨®n fue la manera de resolver el problema", explica Chema Alonso, CDO de Telef¨®nica. Las Joyas son funcionalidades que permiten a cada departamento el acceso a la informaci¨®n; est¨¢n pensadas para ser empleadas con interfaces sencillos, sin exigir conocimientos de c¨®mo funcionan los algoritmos. Aura es un sistema de inteligencia artificial que media, usando biometr¨ªa de voz, entre los repositorios que guardan la informaci¨®n y el usuario que la solicita. Estos sistemas crean data spaces, estructuras personalizadas de informaci¨®n pensadas para su consulta. La compa?¨ªa quiere que sus clientes se beneficien de ella.
Pol¨ªticas teledirigidas con datos
James A. George, consultor del Gobierno de Estados Unidos en asuntos de rendimiento, y James A. Rodgers, profesor de Informaci¨®n y Tecnolog¨ªa en la Universidad de Pensilvania, firmaron a d¨²o una de las obras cl¨¢sicas de la materia: Smart data. Estrategia de optimizaci¨®n de rendimiento para empresas (Wiley, 2010). En ella se adelantaron a la moda al concebir la gesti¨®n de datos inteligentes como el gran fulcro que iba a revolucionar empresas y gobiernos en el medio plazo. Hoy, ambos consideran que sus beneficios en las instituciones p¨²blicas son, potencialmente, ¡°inagotables¡±.
¡°El impacto puede ser enorme. Local, nacional y globalmente. Hoy los gobiernos deben manejar asuntos complej¨ªsimos que afectan a millones de personas. Implementar una plataforma de big data en un Gobierno no solo permite delimitar las ¨¢reas que requieren m¨¢s atenci¨®n, sino que ofrece los datos en tiempo real. En una sociedad que se mueve tan veloz, este an¨¢lisis seg¨²n suceden las cosas es vital¡±, explica George. Este experto abunda tambi¨¦n en beneficios concretos para ¨¢reas tan relevantes como la salud. La mara?a de subcontrataciones de este sector y el complej¨ªsimo entramado de centros hospitalarios provocan que se ignore si los recursos se est¨¢n destinando de manera justa y efectiva entre la poblaci¨®n. George cree que aplicar tecnolog¨ªas de smart data para gestionar la salud permitir¨¢ conocer al Gobierno qu¨¦ gastos debe priorizar y cu¨¢les son las necesidades m¨¢s acuciantes.
Rayid Ghani, responsable del an¨¢lisis de datos de la reelecci¨®n de Obama en 2012, se encuentra trabajando en esta direcci¨®n. Su pr¨®ximo libro lleva por t¨ªtulo Big data y ciencia social. Una gu¨ªa pr¨¢ctica de m¨¦todos y herramientas. ¡°Creo que hay que incidir en lo pr¨¢ctico porque si no alcanzamos la aplicaci¨®n, nada cambia. Los gobiernos tienen hoy tres problemas a resolver: desconocen las tecnolog¨ªas ya disponibles, no tienen al personal que podr¨ªa aplicarlas y carecen de las herramientas necesarias para su despliegue. Por eso es necesario educar a las instituciones sobre lo que ya pueden hacer. Pero tambi¨¦n a los estudiantes expertos en el an¨¢lisis de datos que ser¨¢n futuros funcionarios para que puedan afrontar las complejidades que tiene aplicar sus conocimientos a la Administraci¨®n¡±, detalla Ghani.
El dato en Repsol
De extracciones sabe mucho Santiago Quesada, director de Proyectos de Tecnolog¨ªa de Exploraci¨®n y Producci¨®n de Repsol. Su compa?¨ªa se enfrenta a un problema que solo puede resolverse mediante esta tecnolog¨ªa: la incertidumbre. Cuando se busca un nuevo suelo del que extraer petr¨®leo o gas, la inc¨®gnita de qu¨¦ puede haber abajo, a kil¨®metros de profundidad, es enorme: "Hablamos, a veces, de incertidumbre total, del 100%. Esto redunda en una mayor dificultad en la toma de decisiones", explica Quesada. La respuesta de Repsol, en un desarrollo en alianza con la inteligencia artificial Watson de IBM, tiene un doble nombre mitol¨®gico: Pegasus-Excalibur. La idea es plantear un c¨®ctel de m¨²ltiples tecnolog¨ªas ¡ªciencia cognitiva, machine learning o redes neuronales convolucionales¡ª para poder reducir el n¨²mero de variables en juego y reaccionar a los cambios que se puedan dar en la extracci¨®n en tiempo real. "Se trata de automatizar este proceso hasta el punto de que el sistema nos plantee los escenarios de los que podemos obtener mayor rentabilidad".
Del dicho al hecho
Las conversaciones entre empresas para colaborar con un mismo fin es otra de las tendencias a las que lleva el smart data. Aunque hay especialistas como Greg DeMichillie, directivo de Google, que ve obst¨¢culos en la mentalidad de las compa?¨ªas para que esto se generalice. ¡°La colaboraci¨®n para abordar proyectos comunes exige de homogeneizar los datos. Ahora bien, las empresas son celosas de hacerlo por dos motivos: perder ventajas competitivas frente a sus rivales y el problema de la ciberseguridad al compartir sus datos. Creo que la filosof¨ªa open source [liberar el c¨®digo de un software para que cualquiera pueda modificarlo] va a seguir siendo la dominante. De hecho, compa?¨ªas como nosotros o Facebook no existir¨ªamos sin ella. Veo m¨¢s dif¨ªcil esa colaboraci¨®n abierta y masiva entre compa?¨ªas para que corran los flujos de datos y se intente innovar as¨ª en nuevos servicios para los usuarios¡±.
La pregunta fundamental es c¨®mo puede usarse esta tecnolog¨ªa m¨¢s all¨¢ de las grandes empresas. Las pymes son responsables, seg¨²n datos del Banco Mundial, de al menos el 60% de los empleos y el 40% del PIB mundial. Es decir, ellas son el coraz¨®n que bombea la econom¨ªa. Para expertos como Rayid Ghani, responsable de la estrategia de datos de la campa?a de reelecci¨®n de Obama, hay mucho que se puede hacer. ¡°Por un lado, en pa¨ªses como Estados Unidos es extremadamente sencillo comprar los datos que necesitas para saber d¨®nde te conviene abrir un negocio. Pero por otro las compa?¨ªas peque?as de un mismo sector podr¨ªan unirse para compartir sus datos y de esta manera plantar cara a las grandes empresas¡±.
Ghani explica c¨®mo este sistema, similar al de los gremios medievales, permitir¨ªa a las pymes conseguir masa cr¨ªtica de datos para tomar decisiones relevantes: ¡°Individualmente, es imposible que logren la cantidad necesaria de informaci¨®n. Pero juntas, podr¨ªan¡±. Chema Alonso, ejecutivo de Telef¨®nica, ve que a esta democratizaci¨®n de la tecnolog¨ªa le queda un punto de maduraci¨®n: ¡°Aunque la automatizaci¨®n del an¨¢lisis de datos se est¨¢ convirtiendo en una commodity [universalizando], a d¨ªa de hoy todav¨ªa la autonom¨ªa de estas soluciones no es plena y sigue siendo necesario reclutar talento para dar soporte a estas tareas. Respecto a los datos, es importante que las fuentes que se vayan a procesar tengan la calidad suficiente¡±. Es decir, que nuevamente no vale solo con el big. Los datos, sean para una pyme min¨²scula o para la multinacional m¨¢s gigante, tienen que ser avispados. Tienen que ser smart.
Glosario: big data para novatos
Big data: Volumen de informaci¨®n cuya gesti¨®n es muy dif¨ªcil siguiendo los m¨¦todos tradicionales de tratamiento de informaci¨®n.
Smart data: Aquella informaci¨®n v¨¢lida y con sentido para extraer conclusiones que lleven a tomas de decisiones para cualquier tipo de entidad, sea una empresa o un gobierno.
Data Lake: Es la gigantesca base de datos donde se acumula la informaci¨®n en crudo. Est¨¢ pensado para simplificar el almacenaje de una empresa a un solo lugar. Los m¨¢s conocidos son Azure de Microsoft y Amazon S3.
Dato estructurado: Aquel que tiene un formato estandarizado, pensado para su empleo por posteriores algoritmos y aplicaciones. Dato no estructurado: Aquel que carece de cualquier tipo de tratamiento o protocolo. Puede ser de cualquier tipo, como el dato de un sensor f¨ªsico o un documento escaneado.
APIS: Los puentes internos entre programas inform¨¢ticos. En el caso del big data, son aquellos algoritmos intermedios entre el acceso al repositorio que contiene la informaci¨®n y el programa que ejecuta el usuario.
MySQL: El sistema gestor de datos open source (cualquiera puede acceder a su c¨®digo y modificarlo) m¨¢s popular del mundo. Es la arquitectura que permite el almacenamiento, modificaci¨®n y extracci¨®n de la informaci¨®n en una base de datos.
Machine learning: Algoritmos matem¨¢ticos que pueden aprender a optimizar la tarea que se les encomienda. Pero los principios que subyacen a sus comportamientos son reglas. No se aspira a un pensamiento libre que se reinvente a s¨ª mismo.
Computaci¨®n cognitiva: Inform¨¢tica orientada a emular la forma de resolver problemas de los humanos, aplicando conceptos como memoria, pensamiento o contextualizaci¨®n.
Tu suscripci¨®n se est¨¢ usando en otro dispositivo
?Quieres a?adir otro usuario a tu suscripci¨®n?
Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.
FlechaTu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.
?Tienes una suscripci¨®n de empresa? Accede aqu¨ª para contratar m¨¢s cuentas.
En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.