Humanizar los datos
Los n¨²meros nunca hablan por s¨ª solos, necesitan el contexto de los sondeos
En la nueva era del conocimiento que se abre ahora, el big data ¡ªes decir, la disponibilidad de datos a lo grande (a lo inmenso, por mejor decir)¡ª y los sondeos de opini¨®n se necesitan mutuamente. Han de ir, forzosamente, de la mano. Si esto no resulta tan obvio como debiera, se debe sin duda al inadecuado entendimiento general de lo que los sondeos realmente son y a la fe tan ciega como difusa, por parte de algunos, respecto de lo que el big data, por s¨ª solo, puede conseguir.
Los sondeos de opini¨®n nacieron con la intenci¨®n de contribuir a un mejor conocimiento de los valores, emociones, actitudes y opiniones de los ciudadanos: es decir, de los factores m¨¢s susceptibles de moldear y encarrilar su comportamiento. El objetivo era captar y medir, de forma regular, el pulso social ¡ªen expresi¨®n de Gallup¡ª, es decir, las evoluciones del estado de ¨¢nimo colectivo. No fueron concebidos para predecir comportamientos, sino para describir las predisposiciones ciudadanas a actuar en un sentido u otro. Su objetivo es arrojar luz sobre los climas de opini¨®n que puedan existir, y obrar como una especie de br¨²jula que indique la direcci¨®n del sentir colectivo. (Este es, por cierto, el ¨²nico sentido posible de los sondeos preelectorales, por m¨¢s que hayamos todos condescendido, con err¨®nea ligereza, a falsear su funci¨®n concedi¨¦ndoles un valor predictivo que solo de forma muy aproximada y tangencial pueden llegar a tener).
Por su parte, el big data se aparece como un nuevo El Dorado: una tierra de incalculable riqueza informativa. Nunca, antes, ha existido una masa de informaci¨®n tan abrumadoramente masiva (y, adem¨¢s, en permanente y exponencial crecimiento) sobre pr¨¢cticamente todos los aspectos de la vida. Nosotros mismos la vamos creando, tan constante como inadvertidamente, con las continuas pistas que vamos dejando sobre nuestros gustos, intereses o incluso salud cuando utilizamos Internet (Google, Amazon, Twitter o Facebook) o la ahora menos glamurosa pero ya universal tarjeta de cr¨¦dito. Toda esta informaci¨®n, considerada antes exhaust data, es decir, datos desechables y sin mayor utilidad aparente, constituye en realidad, en su pr¨¢cticamente inabarcable magnitud, una mina informativa de inimaginable riqueza sobre la vida social. Requiere ¨²nicamente ser excavada y desvelada. Y de ah¨ª la actual pujante eclosi¨®n del data mining (miner¨ªa de datos) y de los algoritmos, equivalente hipersofisticado, en este contexto, al cl¨¢sico instrumental minero (plano, pico y pala). Falta tan solo el casco, con luz incorporada, y el canario (por si hay gris¨²), que es lo que al equipamiento pueden aportar los sondeos de opini¨®n.
Los n¨²meros nunca hablan por s¨ª solos, nunca son autoexplicativos
Incluso los m¨¢s alambicados algoritmos, si carecen de ¡°la luz desde dentro¡± que, sobre los factores moldeadores de los comportamientos, aportan los sondeos, solamente conseguir¨¢n generar informaci¨®n ¡°externa¡±. Pueden establecer infinitas correlaciones (muchas de ellas sin duda esclarecedoras, otras ambiguas o desconcertantes y otras pura y simplemente carentes de sentido), pero renunciando siempre a explorar las causas subyacentes. Da igual, se ha llegado a decir: ¡°?Para qu¨¦ molestarnos en averiguar por qu¨¦ la gente hace lo que hace? (¡) Con la suficiente cantidad de datos, los n¨²meros hablan por s¨ª solos¡± (Chris Anderson, The End of Theory, 2008, online). No es cierto: los n¨²meros nunca hablan por s¨ª solos, nunca son autoexplicativos.
Sch?nberger y Curlier (Big Data. La revoluci¨®n de los datos masivos; 2013, Turner) han vuelto recientemente, de forma m¨¢s prudente, a esta misma idea: con el big data el objetivo no ser¨¢ ya indagar el porqu¨¦ de los comportamientos, sino la mir¨ªada ¡ªvisible o latente¡ª de asociaciones existentes entre estos. Con eso ser¨¢ suficiente. Pues no. Aunque el big data llegara alg¨²n d¨ªa a equivaler a todos-los-datos-posibles-existentes, nos seguir¨ªa faltando algo esencial para su mejor comprensi¨®n y, con ellos, de la vida social: la percepci¨®n directa ¡ªno deducida¡ª del mundo de las motivaciones y de las causas.
Tim Harford, en un equilibrado balance de los pros y contras de este nuevo tiempo (¡®Big Data: are we making a big mistake?¡¯, FT Magazine, marzo de 2014) nos advierte: ¡°Big Data have arrived, but the insights have not¡±. O lo que es igual, estamos avanzando inmensamente en t¨¦rminos de informaci¨®n disponible, pero no de forma paralela en cuanto a capacidad de comprensi¨®n de lo que esta pueda significar.
En uno de sus textos m¨¢s citados, Pascal distingue entre lo que designa como ¡°esp¨ªritu de geometr¨ªa¡± y ¡°esp¨ªritu de finura¡±. Cabe entender por el primero la solidez y el rigor; por el segundo, la sagacidad y la perspicacia, sobre todo frente a la ambig¨¹edad (y por ende, frente al cambio, que es lo m¨¢s dif¨ªcil de modelizar). El propio Pascal se?alaba que ambos se complementan y necesitan: sin la adecuada solidez, la perspicacia deriva f¨¢cilmente en mera ocurrencia; el rigor, falto de sagacidad, conduce a espejismos o a la oscuridad. Por ello, big data y sondeos de opini¨®n, adecuadamente entendidos y readaptados en cuanto haga falta, ni rivalizan ni son incompatibles; en realidad, se complementan y potencian.
Jos¨¦ Juan Toharia es presidente de Metroscopia.
Tu suscripci¨®n se est¨¢ usando en otro dispositivo
?Quieres a?adir otro usuario a tu suscripci¨®n?
Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.
FlechaTu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.
En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.