La fragilidad de la informaci¨®n cient¨ªfica en la incierta situaci¨®n actual
La descentralizaci¨®n de los datos emerge como un elemento crucial en el panorama internacional actual, marcado por la incertidumbre y la volatilidad

En un contexto internacional inestable, la retirada de informaci¨®n de salud p¨²blica por los Centros para el Control y la Prevenci¨®n de Enfermedades de EE.UU (CDC) o la reciente ca¨ªda de los servidores del Instituto Nacional de Salud (NIH), sin una clara explicaci¨®n, podr¨ªan no sorprender, pero son hechos graves que parecen indicar un cambio dr¨¢stico en el ecosistema de datos y nos llevan a replantear la como la informaci¨®n biol¨®gica y m¨¦dica est¨¢ organizada. Esta inquietante situaci¨®n no se limita a este ¨¢mbito. En el ¨¢rea de clima, por ejemplo, los recientes despidos en agencias estadounidenses dedicadas a la monitorizaci¨®n del cambio clim¨¢tico han evidenciado c¨®mo la dependencia de sistemas centralizados pone en riesgo informaci¨®n crucial en dominios que van desde al estudio del clima, la preparaci¨®n para nuevas pandemias o el avance en el tratamiento de enfermedades.
En biolog¨ªa y biomedicina, el conocimiento acumulado durante d¨¦cadas est¨¢ contenido en cientos de miles de publicaciones, bases de datos y repositorios especializados. Los CDC, por ejemplo, albergan informaci¨®n cr¨ªtica sobre vigilancia de enfermedades, tasas de vacunaci¨®n, brotes epidemiol¨®gicos y directrices de salud p¨²blica, incluyendo datos sobre salud femenina y desigualdades en el acceso a la sanidad. Durante la pandemia de COVID-19, los datos proporcionados por los CDC fueron esenciales para rastrear la propagaci¨®n del virus y guiar las pol¨ªticas de salud.
Por su parte, PMC/PubMed, producido por la Biblioteca Nacional de Medicina (NLM) del Instituto de Salud americano (NIH), almacena res¨²menes y publicaciones cient¨ªficas indispensables para planear e interpretar nuevos experimentos. Sin embargo, estos recursos ¨²nicos, producidos por instituciones gubernamentales, son vulnerables a intervenciones pol¨ªticas, como hemos visto recientemente.
Un modelo alternativo lo ofrecen bases de datos organizadas en torno a colaboraciones internacionales. UniProt es una base de datos global que recopila y organiza informaci¨®n sobre prote¨ªnas, las mol¨¦culas que realizan la mayor¨ªa de las funciones en nuestros cuerpos, desde digerir alimentos hasta combatir infecciones. Por otro lado, PDB (Protein Data Bank) se especializa en almacenar las estructuras tridimensionales de estas prote¨ªnas, lo que permite a los cient¨ªficos visualizar c¨®mo funcionan a nivel molecular. La informaci¨®n en estas bases de datos es fundamental para desarrollar nuevos medicamentos, como vacunas o tratamientos para el c¨¢ncer, e incluso para dise?ar prote¨ªnas que resuelvan problemas acuciantes, como la descomposici¨®n de pl¨¢sticos
Estas bases de datos no solo son fundamentales para el progreso cient¨ªfico en muchas dimensiones, incluido ser instrumentales para el desarrollo de sistemas inteligencia artificial en biolog¨ªa y medicina. Por ejemplo, los sistemas de IA que ganaron el Premio Nobel de Qu¨ªmica en 2021¡ªpor predecir con precisi¨®n la estructura de las prote¨ªnas y como modificarlas¡ªse entrenaron utilizando la informaci¨®n abierta y gratuita proporcionada por UniProt y PDB. Sin estos datos, avances como este no habr¨ªan sido posibles.
M¨¢s cercano a nosotros, el European Genome-Phenome Archive (EGA), es una base de datos almacena informaci¨®n sobre genomas humanos¡ªpor ejemplo, derivados del estudio de miles de casos de c¨¢ncer¡ªy es considerada de m¨¢ximo valor a nivel mundial. EGA es gestionada conjuntamente por el Centro de Regulaci¨®n Gen¨®mica (CRG) y el Laboratorio Europeo de Biolog¨ªa Molecular (EMBL-EBI), con datos almacenados en el Barcelona Supercomputing Center (BSC) y el propio EMBL-EBI.
Un ejemplo m¨¢s cercano es el European Genome-Phenome Archive (EGA), una base de datos esencial a nivel mundial que almacena informaci¨®n sobre genomas humanos¡ªel conjunto completo de genes que definen nuestras caracter¨ªsticas biol¨®gicas. Por ejemplo, EGA contiene datos derivados del estudio de miles de casos de c¨¢ncer, lo que permite a los investigadores identificar mutaciones gen¨¦ticas asociadas con esta enfermedad. Esta base de datos es gestionada de manera colaborativa por el Centro de Regulaci¨®n Gen¨®mica (CRG) y el Laboratorio Europeo de Biolog¨ªa Molecular (EMBL-EBI), con datos almacenados en el Barcelona Supercomputing Center (BSC) y el propio EMBL-EBI. Esta base de datos ocupa 16PB, que es equivalente a unos 3 billones de canciones almacenadas en formato MP3.
Estos ejemplos ilustran una alternativa viable: un modelo basado en la colaboraci¨®n internacional. Este enfoque no solo garantiza el acceso a la informaci¨®n incluso si uno de los nodos falla, sino que tambi¨¦n mejora la resiliencia, fomenta la cooperaci¨®n global y promueve el acceso abierto a la ciencia. Adem¨¢s, permite que los socios se especialicen en aspectos tecnol¨®gicos concretos, mejorando los procesos de acceso a la informaci¨®n sin crear dependencias irreversibles.
La descentralizaci¨®n se revela como un elemento crucial en el panorama internacional actual, marcado por la incertidumbre y la volatilidad. Sin embargo, no est¨¢ exenta de desaf¨ªos. Requiere acuerdos internacionales y marcos de gobernanza robustos para garantizar que los datos sigan siendo accesibles y est¨¦n bien gestionados. Tambi¨¦n exige inversiones sostenidas, que, en cualquier caso, ser¨¢n menores que el costo de la p¨¦rdida de datos que acabe siendo devastador para la investigaci¨®n biom¨¦dica y la salud p¨²blica.
Un ejemplo destacado de colaboraci¨®n internacional es la incorporaci¨®n esta misma semana de Canad¨¢ al consorcio europeo, con Espa?a, Finlandia, Alemania, Noruega, Suecia, Polonia y Portugal, que gestiona la versi¨®n federada de la base de datos EGA. La versi¨®n federada del EGA es un ejemplo de c¨®mo la tecnolog¨ªa puede adaptarse a las normativas de privacidad, como lo que entran en vigor con el nuevo espacio Europeo de datos m¨¦dicos (European Health Data Space, EHDS). En este sistema, los datos gen¨®micos de cada pa¨ªs se almacenan localmente, sin salir de sus fronteras, pero pueden ser analizados de manera conjunta gracias a un software especializado. Estos sistemas de datos y an¨¢lisis federado permiten a los investigadores de diferentes pa¨ªses trabajar con los mismos datos de manera simult¨¢nea y segura, sin comprometer la privacidad de los individuos cuyos genomas est¨¢n siendo estudiados. Este enfoque es esencial para el tratamiento de datos sensibles, como los gen¨®micos, cl¨ªnicos o de imagen m¨¦dica.
Los acontecimientos recientes demuestran que Europa no puede dar por sentado el acceso a la informaci¨®n cient¨ªfica. Es imperativo completar los sistemas y procesos que eviten dependencias cr¨ªticas, adoptando tecnolog¨ªas que permitan la creaci¨®n de entornos colaborativos y descentralizados. Bases de datos como PDB o EGA federada marcan el camino a seguir para que la ciencia siga siendo libre, abierta y resiliente frente a las circunstancias pol¨ªticas. Este esfuerzo no solo beneficiar¨¢ la investigaci¨®n cient¨ªfica y la salud p¨²blica, sino que tambi¨¦n impulsar¨¢ el progreso social.
Alfonso Valencia es Profesor ICREA en el Departamento de Ciencias de la Vida del Barcelona Supercomputing Center.
Tu suscripci¨®n se est¨¢ usando en otro dispositivo
?Quieres a?adir otro usuario a tu suscripci¨®n?
Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.
FlechaTu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.
?Tienes una suscripci¨®n de empresa? Accede aqu¨ª para contratar m¨¢s cuentas.
En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.