As¨ª es Cardiomentor, la primera aplicaci¨®n p¨²blica basada en la IA espa?ola
La herramienta, una especie de ChatGPT para m¨¦dicos centrado en cardiopat¨ªas, se entrenar¨¢ a partir de 2026 con datos de historias cl¨ªnicas de miles de pacientes para ofrecer respuestas personalizadas

La familia de modelos de inteligencia artificial (IA) generativa espa?ola, Alia, tendr¨¢ una primera aplicaci¨®n p¨²blica antes de acabar el a?o. Se llama Cardiomentor y la est¨¢n desarrollando Tecnalia y el Barcelona Supercomputing Center (BSC) en colaboraci¨®n con la Sociedad Espa?ola de Cardiolog¨ªa. En una primera fase, actualmente en ejecuci¨®n, Cardiomentor se apoyar¨¢ en los modelos fundacionales Alia para desarrollar una especie de ChatGPT especializado en cardiopat¨ªas para los m¨¦dicos generalistas, con el objetivo de que estos tengan f¨¢cil acceso a conocimiento actualizado y veraz sobre estas dolencias.
Una vez completada esta fase, el sistema se entrenar¨¢ con datos anonimizados de pacientes con el objetivo de afinar la capacidad de predicci¨®n y diagn¨®stico de la herramienta. La idea es que el modelo sea capaz de analizar una serie de par¨¢metros del paciente y poder decirle al m¨¦dico, por ejemplo, qu¨¦ tipo de tratamientos han funcionado con otros sujetos que presentaban condiciones muy similares.
Esta segunda parte del proyecto, que se licitar¨¢ este a?o y se empezar¨¢ a implementar el que viene, presenta varias inc¨®gnitas. ?Qui¨¦n se ocupar¨¢ de anonimizar y custodiar los datos de las historias cl¨ªnicas de los pacientes? ?Qu¨¦ tecnolog¨ªa se usar¨¢ para ello? ?Qui¨¦n supervisar¨¢ que el proceso se realice de forma segura? Fuentes de la Secretar¨ªa de Estado de Digitalizaci¨®n e Inteligencia Artificial, dependiente del Ministerio de Transformaci¨®n Digital y Funci¨®n P¨²blica y que ha asumido la coordinaci¨®n del proyecto, explican a EL PA?S que el foco est¨¢ todav¨ªa puesto en la primera, as¨ª que todas estas cuestiones est¨¢n todav¨ªa ¡°por definir¡±.
Primera fase: un asistente en cardiolog¨ªa
Unas 800.000 personas padecen insuficiencia card¨ªaca en Espa?a. Su incidencia es alta en personas mayores y con morbilidades, y se ha estimado que su impacto econ¨®mico puede ser de unos 2.500 millones de euros anuales (se atribuyen a cardiopat¨ªas unos 10.000 ingresos hospitalarios al a?o). ¡°Nos pareci¨® que la insuficiencia card¨ªaca es una patolog¨ªa que afecta a muchas personas y tiene un gran impacto en el sistema sanitario, por lo que pod¨ªa ser un buen punto de partida para empezar a usar el gran modelo de lenguaje (LLM por sus siglas inglesas) que ha desarrollado el Gobierno¡±, explica el doctor Juli¨¢n Villacast¨ªn, jefe de cardiolog¨ªa del Hospital Cl¨ªnico San Carlos de Madrid y expresidente de la Sociedad Espa?ola de Cardiolog¨ªa (SEC).
Villacast¨ªn encabeza el equipo de la SEC que ha trabajado en la prueba de concepto de asistente en insuficiencia cardiaca para m¨¦dicos generales (Cardiomentor). ¡°Inicialmente, ser¨¢ una herramienta formativa: ayudar¨¢ a los generalistas a estar al d¨ªa y tomar decisiones, que ser¨¢n siempre solo suyas¡±. El doctor y sus colegas ser¨¢n los curadores del contenido con el que se entrene el modelo: art¨ªculos cient¨ªficos rese?ables y gu¨ªas cl¨ªnicas que reflejen el consenso de los expertos. ¡°Va a ser un modelo vivo, iremos incluyendo novedades seg¨²n se vayan publicando¡±, a?ade.
La prueba de concepto en la que trabajan ahora mismo tiene un presupuesto de 50.000 euros, seg¨²n confirma la Secretar¨ªa de Estado. Ha sido elaborada por Tecnalia con los medios del BSC y el asesoramiento de la Sociedad Espa?ola de Cardiolog¨ªa. Villacast¨ªn cree que el prototipo formativo puede estar listo en unos meses. ¡°Solo con que te conteste a preguntas cient¨ªficas con la seguridad de que las respuestas de la herramienta no tengan sesgos, eso ser¨¢ muy valioso¡±, dice. El hecho de que se base en Alia y, por tanto, funcione bien en castellano, hace que Cardiomentor sea susceptible de ser usado en cualquier pa¨ªs de habla hispana.
Can we really trust AI in critical areas like medical image diagnosis? No, and they are even worse than random. Our latest study, "Worse than Random? An Embarrassingly Simple Probing Evaluation of Large Multimodal Models in Medical VQA," uncovers the stark limitations of¡ pic.twitter.com/pt3d02RZcM
— Xin Eric Wang (@xwang_lk) June 3, 2024
Sin embargo, la idea de aplicar grandes modelos de lenguaje al sector m¨¦dico ha sido cuestionada por la literatura cient¨ªfica. ¡°El problema fundamental de los LLM es que sus resultados no son replicables. Son modelos estoc¨¢sticos: con unos mismos inputs llega a distintos outputs, el sistema te dar¨¢ respuestas diferentes ante un mismo problema¡±, explica Lorena Jaume-Palas¨ª, investigadora independiente en ¨¦tica y tecnolog¨ªa. ¡°Los LLMs no son capaces de distinguir entre art¨ªculos cient¨ªficos antiguos, sexistas y desfasados y nuevas informaciones, y ese es un problema conocido¡±, abunda la experta.
Los datos generados por Cardiomentor ser¨¢n propiedad de Tecnalia, aunque el BSC y la Direcci¨®n General de Inteligencia Artificial tendr¨¢n una licencia sobre los mismos. Antes de empezar a funcionar, la herramienta ser¨¢ validada m¨¦dicamente por la propia Sociedad Espa?ola de Cardiolog¨ªa. El doctor Villacast¨ªn conoce los estudios que ponen en duda la val¨ªa de los LLM en cuestiones m¨¦dicas. ¡°Por eso tenemos que hacer un modelo que sea lo m¨¢s fiable posible, y en eso estamos trabajando¡±, apunta.
Segunda fase: un modelo predictivo
Una vez est¨¦ listo el asistente, la intenci¨®n es a?adirle casos reales para poder extraer conclusiones de utilidad m¨¦dica. Eso se lograr¨¢ introduciendo en el modelo datos de las historias cl¨ªnicas de pacientes que hayan sufrido cardiopat¨ªas. ¡°Existen multitud de interacciones entre distintos aspectos personales, sociales y terap¨¦uticos que influyen en el paciente, y muchas veces es dif¨ªcil detectarlos con los medios que tenemos¡±, indica el doctor Villacast¨ªn. Depresiones, situaci¨®n familiar, tipo de alimentaci¨®n, tipo de trabajo¡ ¡°La complejidad de la interacci¨®n es tremenda. Si tenemos mucho conocimiento, eventualmente podremos llegar a desarrollar pr¨¢cticamente gemelos digitales: saber que a tal persona le puede servir tal tratamiento, porque ya se ha visto que ha funcionado con otros 1.000 pacientes que presentaban caracter¨ªsticas similares¡±.
La calidad de los datos que necesitan para entrenar el modelo est¨¢ haciendo que Villacast¨ªn y sus colegas sean muy restrictivos. ¡°Quiz¨¢s podamos reunir las historias cl¨ªnicas de 2.000 o 3.000 sujetos. Primero integraremos datos de pacientes que tienen esta patolog¨ªa para saber por qu¨¦ han tenido que ser readmitidos en el hospital, por qu¨¦ han tenido complicaciones o por qu¨¦ ha ido todo bien, qu¨¦ factores han ayudado o perjudicado, etc¨¦tera. Ya estamos dise?ando el conjunto de datos que queremos introducir para alimentar el modelo¡±, se?ala.
¡°El objetivo es conseguir que el modelo sea capaz de decir que, dadas tus caracter¨ªsticas y la experiencia en casos similares, si sigues fumando tendr¨¢s X probabilidades de sufrir un ictus, un infarto o c¨¢ncer de pulm¨®n entre los 35 y los 60 a?os¡±, resume el doctor. La idea, a muy largo plazo, ser¨ªa desarrollar gemelos digitales de los pacientes: r¨¦plicas lo m¨¢s parecidas posible a estos.
Jaume-Palas¨ª considera que esta aproximaci¨®n es problem¨¢tica. ¡°La idea de usar gemelos digitales en medicina me parece preocupante porque no se trata de entender mejor a un paciente, sino de perfilar, y eso es una forma de precarizaci¨®n, porque acaba minimizando el contacto del paciente con el m¨¦dico¡±.
El modelo fundacional espa?ol
La familia de modelos de IA generativa Alia, presentada por el Gobierno en enero, no pretende competir con ChatGPT, Gemini ni DeepSeek, sino poner a disposici¨®n de todo el mundo una herramienta que funcione bien en castellano y en las lenguas cooficiales. As¨ª, un 20% de todos los textos con los que se ha entrenado son en castellano, catal¨¢n, gallego y euskera (el ingl¨¦s, con casi el 40%, es el predominante). Puede parecer una proporci¨®n baja, pero es muy superior a la usada por los modelos m¨¢s conocidos. Eso le imprimir¨¢ a los modelos Alia una fiabilidad superior, m¨¢s conocimiento de frases hechas y expresiones patrias y menos probabilidades de equivocarse. ¡°Creemos que vamos a conseguir superar sesgos culturales¡±, dijo la secretaria de Estado de Digitalizaci¨®n e IA, Mar¨ªa Gonz¨¢lez Veracruz, en una reuni¨®n con periodistas.
Alia es un proyecto de c¨®digo abierto, por lo que cualquier particular o empresa puede descargarlo y manipularlo. Adem¨¢s de una mayor fiabilidad en el idioma, Alia aporta la garant¨ªa de cumplimiento con las normativas europeas aplicables, tanto en transparencia como en derechos de autor. El modelo se ha entrenado con documentaci¨®n p¨²blica oficial: desde el hist¨®rico de los boletines del BOE o el Bolet¨ªn Oficial del Registro Mercantil hasta las intervenciones parlamentarias o resoluciones judiciales. El Gobierno ha dedicado 2,2 millones de euros a desarrollar el algoritmo y otros ocho a la infraestructura necesaria, aportada por el BSC, y a configurar las bases de datos. Ya se est¨¢ trabajando en el dise?o de nuevos casos de uso, m¨¢s all¨¢ de Cardiomentor y de una aplicaci¨®n piloto interna de la Agencia Tributaria pensada para agilizar los tr¨¢mites burocr¨¢ticos.
¡°Los modelos Alia han tenido limitaciones presupuestarias en comparaci¨®n con otras herramientas del mercado, pero tiene puntos fuertes. Yo destacar¨ªa que se le ha dado peso al espa?ol y las lenguas cooficiales, y podemos ir curando los contenidos para corregir sesgos; y que tienen la garant¨ªa de que cumplen con el Reglamento Europeo de IA¡±, subraya Andr¨¦s Pedre?o, exrector de la Universidad de Alicante y fundador y presidente de 1millionbot. Pedre?o ha sido uno de los expertos a los que ha confiado el Gobierno la evaluaci¨®n del modelo.
¡°Nosotros hemos hecho alguna prueba con los modelos Salamandra [los menos sofisticados] de Alia y con el ¨²ltimo, el 40B, y, de momento, los resultados son un poco irregulares¡±, explica ?lvaro Barbero, director de Inteligencia Artificial en el Instituto de Ingenier¨ªa del Conocimiento. ¡°Mi equipo ha hecho pruebas y todos ellos, especialmente los Salamandra, est¨¢n por debajo de los modelos a enero de 2025. Si lo comparamos con Llama, el modelo de c¨®digo abierto de Meta, que va por su versi¨®n 3.2, Alia ser¨ªa equivalente a Llama 2, que tiene a?o y medio¡±, apunta.
Tu suscripci¨®n se est¨¢ usando en otro dispositivo
?Quieres a?adir otro usuario a tu suscripci¨®n?
Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.
FlechaTu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.
?Tienes una suscripci¨®n de empresa? Accede aqu¨ª para contratar m¨¢s cuentas.
En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.
Sobre la firma
