Google identifica millones de mutaciones en las prote¨ªnas capaces de generar enfermedades
La ciencia solo hab¨ªa clasificado el 2% de las variaciones detectadas hasta hoy gracias a la inteligencia artificial de DeepMind
Es el santo grial de la medicina moderna: identificar las alteraciones en el genoma que provocan la aparici¨®n de enfermedades de origen gen¨¦tico. La tarea no es f¨¢cil, hay miles de mutaciones en cada persona respecto de la informaci¨®n gen¨¦tica que hered¨® de sus padres. La mayor¨ªa son benignas, pero hay un porcentaje que pueden ser patog¨¦nicas. Ahora, investigadores de Google DeepMind, la empresa de inteligencia artificial de Alphabet, han catalogado 71 millones de estas mutaciones. El programa tambi¨¦n pudo clasificarlas, encontrando que un tercio podr¨ªa modificar el funcionamiento de las prote¨ªnas, provocando serias patolog¨ªas.
El ADN contiene las instrucciones para el desarrollo de todo ser vivo. Este libro contiene cada una de sus recetas para crear c¨¦lulas, ¨®rganos y funciones en forma de secuencias de sus componentes b¨¢sicos. Estos componentes b¨¢sicos, los ladrillos de la vida, son las prote¨ªnas. Est¨¢n formadas por series de amino¨¢cidos, a veces centenares, que a su vez, est¨¢n formados por tr¨ªos de nucle¨®tidos, las letras del abecedario gen¨¦tico. Cuando uno de estos nucle¨®tidos es reemplazado por otro en un tipo de mutaci¨®n, se denomina variante contrasentido. En su mayor¨ªa, estas variantes no afectan a la funci¨®n de la prote¨ªna. Pero en otros casos, la mutaci¨®n es catastr¨®fica, degenerando en patolog¨ªas con la esclerosis lateral amiotr¨®fica (ELA) de base gen¨¦tica o la anemia de c¨¦lulas falciformes.
Hasta ahora, se hab¨ªan identificado unos 4 millones de estas variantes contrasentido (missense variants, en ingl¨¦s) en las 19.233 prote¨ªnas que forman cada ser humano. Pero solo en el 2% de casos hab¨ªan sido anotadas, es decir, cuando se sabe si son benignas (la mayor¨ªa) o si pueden ser fuente de enfermedades. Ahora, la inteligencia artificial (IA) ha multiplicado por 18 el n¨²mero de variantes conocidas y clasificado la mayor¨ªa de ellas por potencial impacto en el funcionamiento de las prote¨ªnas.
Los autores de este logro, publicado en la prestigiosa revista cient¨ªfica Science, son cient¨ªficos de DeepMind. Es el mismo grupo que desarroll¨® hace unos a?os AlphaFold, un programa de IA capaz de predecir la estructura de la pr¨¢ctica totalidad de las prote¨ªnas y considerado uno de los mayores avances de la biolog¨ªa computacional. Lo que han hecho ahora ha sido redise?arlo y reorientarlo para detectar mutaciones contrasentido en la expresi¨®n de las prote¨ªnas. Adem¨¢s, en su entrenamiento, la nueva herramienta, AlphaMissense, clasifica con elevada probabilidad el impacto que esta variante puede tener en la funci¨®n de la prote¨ªna.
AlphaMissense
El investigador de Deep Mind Jung Chen, primer autor del estudio, explica lo que hace AlphaMissense: ¡°Sab¨ªamos que AlphaFold era un modelo muy bueno para predecir la estructura tridimensional de las prote¨ªnas partiendo de una secuencia masiva. Tambi¨¦n sab¨ªamos que esta estructura en 3D de las prote¨ªnas es muy importante para su funci¨®n, b¨¢sicamente revelando cu¨¢l es¡±, explica Chen. Si de la estructura se puede deducir su funci¨®n, cualquier alteraci¨®n en esa estructura podr¨ªa ser fruto de una mutaci¨®n. Y otra pieza fundamental es la capacidad de AlphaMissense de aprender de las limitaciones evolutivas de las secuencias relacionadas. Es decir, la evoluci¨®n ha moldeado c¨®mo puede ser la estructura de una prote¨ªna y c¨®mo no deber¨ªa ser si no se quieren problemas. Para este mejorar su conocimiento de este aspecto, el sistema fue entrenado con las estructuras de prote¨ªnas humanas y de primates. ¡°Mediante el entrenamiento, ve millones de secuencias de prote¨ªnas y aprende c¨®mo es una secuencia de prote¨ªnas normal. Y cuando se nos da una con una mutaci¨®n, puede decirnos si mala o no¡±, a?ade
Cheng acaba haciendo una comparaci¨®n: ¡°Esto es muy similar al lenguaje humano. Si sustituimos una palabra de una frase en ingl¨¦s, una persona que est¨¦ familiarizada con el idioma puede ver inmediatamente si esta sustituci¨®n de palabras cambiar¨¢ el significado de la oraci¨®n o no¡±. Su AlphaMissense fue capaz de clasificar el 89% de los 71 millones de variantes contrasentido que identific¨®. De ellas, el 57% eran probablemente benignas y un tercio como probablemente patog¨¦nicas. Del 11% restante la IA no sabr¨ªa su impacto. ¡°El modelo asigna una puntuaci¨®n entre cero y uno a cada una de las variantes e indica la probabilidad de que la variante sea pat¨®gena. Por pat¨®geno, queremos decir que nuestra variante patog¨¦nica tiene m¨¢s probabilidades de estar asociada con una enfermedad o causarla¡±, detalla el cient¨ªfico.
Las aclaraciones de Cheng destacan tanto la fortaleza de AlphaMissense, su alt¨ªsima capacidad para clasificar las variantes, como una de sus debilidades: los porcentajes se refieren a probabilidades. Hasta la era de los potentes ordenadores y la IA, caracterizar la estructura de una prote¨ªna, o de sus mutaciones, era un trabajo tit¨¢nico. Antes de la llegada de estas tecnolog¨ªas, se hab¨ªa conseguido determinar la estructura de unas 200.000 prote¨ªnas, una labor que llev¨® 60 a?os y la participaci¨®n de miles de cient¨ªficos. Para hacerlo se necesitaba muchas horas de laboratorio o el uso de aceleradores de part¨ªculas. Pero eran observaciones reales, de la estructura real de una prote¨ªna real. En el caso de la biolog¨ªa computacional, son prote¨ªnas y variantes virtuales, que despu¨¦s hay que confirmar. En el caso de AlphaMissense, la precisi¨®n lograda para sus c¨¢lculos es del 90%.
¡°Comprender la enfermedad¡±
En cuanto a las posibles aplicaciones, ?iga Avsec, tambi¨¦n de DeepMind y coautor s¨¦nior del estudio, dijo en una conferencia online que, ¡°el primer paso para encontrar tratamientos es tratar de comprender bien la enfermedad y tanto para las enfermedades complejas como para las raras, eso significa encontrar genes asociados con ellas¡±. Para Avsec, herramientas como AlphaMissense, ¡°pueden ayudarnos a intentarlo, a poder identificar mejor las variantes, ayudarnos a descubrir genes potencialmente nuevos; al comprender mejor la gen¨¦tica, podremos tener opiniones m¨¢s s¨®lidas sobre algunos genes de los que antes quiz¨¢ no est¨¢bamos seguros si estaban relacionados con la enfermedad¡±. ¡°Esa es la idea general, a trav¨¦s de una mejor gen¨¦tica, encontrar nuevos genes, obteniendo un poder estad¨ªstico adicional para detectar nuevas asociaciones, pero eso directamente no conducir¨¢ a nuevos medicamentos como tal¡±, a?adi¨®.
Hace unos d¨ªas, se public¨® el an¨¢lisis de los 200 millones de prote¨ªnas descubiertas por AlphaFold el a?o pasado. En ese an¨¢lisis clave particip¨® el bioinform¨¢tico espa?ol, ??igo Barrio. ¡°AlphaFold cambi¨® el mundo¡±, dice Barrio, que no es tan entusiasta con AlphaMissense. ¡°Es relevante, es una nueva forma de evaluar variantes y podr¨ªa servir para monitorear enfermedades raras. Pero ya hay otros software de predicci¨®n¡±. Barrio destaca tambi¨¦n una de las limitaciones de esta inteligencia artificial. AlphaMissense cataloga variantes contrasentido de forma individual, pero muchas de las patolog¨ªas con base gen¨¦tica ¡°son el producto de la combinaci¨®n de varias de estas mutaciones¡±, recuerda.
Una opini¨®n similar expresa el bi¨®logo Jos¨¦ Antonio M¨¢rquez, que dirige la Plataforma de Cristalograf¨ªa del Laboratorio Europeo de Biolog¨ªa Molecular: ¡°Es una de las aplicaciones del m¨¦todo [AlphaFold], quiz¨¢s no es tan relevante a nivel cient¨ªfico, pero s¨ª en el sentido de empezar a transferir un descubrimiento en posibles aplicaciones¡±. Entre esas aplicaciones, M¨¢rquez destaca su uso para acelerar ¡°la investigaci¨®n en enfermedades gen¨¦ticas y particularmente enfermedades raras, puesto que ayuda a generar hip¨®tesis sobre el mecanismo que provoca la enfermedad¡±.
Puedes seguir a MATERIA en Facebook, Twitter e Instagram, o apuntarte aqu¨ª para recibir nuestra newsletter semanal.
Tu suscripci¨®n se est¨¢ usando en otro dispositivo
?Quieres a?adir otro usuario a tu suscripci¨®n?
Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.
FlechaTu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.
En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.