Matem¨¢ticas para hacer frente a los retos de la medicina personalizada
El avance en el conocimiento del genoma humano ha sido firme 20 a?os despu¨¦s de su secuenciaci¨®n completa, pero a¨²n quedan muchas cuestiones por resolver
En junio del a?o 2000, con el esplendor propio de los grandes momentos, el presidente de Estados Unidos Bill Clinton anunci¨® ¨Cjunto con el primer ministro brit¨¢nico Tony Blair¨C la finalizaci¨®n de la secuenciaci¨®n completa del genoma humano, el ¡°dise?o gen¨¦tico de los seres humanos¡±. Se vaticinaba una revoluci¨®n en el conocimiento del fundamento gen¨¦tico de los caracteres biol¨®gicos que nos definen, entre ellos, las enfermedades. Desde aquella presentaci¨®n, ?qu¨¦ ha pasado? ?En qu¨¦ etapa se encuentra la medicina personalizada? Y ?qu¨¦ tienen que ver las matem¨¢ticas en todo esto?
La estrategia parec¨ªa clara. Si hasta entonces se sab¨ªa que unos pocos genes afectan ciertos aspectos de nuestra biolog¨ªa, la disponibilidad de todo el genoma permitir¨ªa extender ese conocimiento a situaciones en que los caracteres fueran determinados por numerosos genes. Los primeros son los llamados caracteres simples y, los segundos, complejos. Equivalentemente, las enfermedades determinadas por unos pocos genes (o un ¨²nico gen) se conocen como mendelianas (por ejemplo, la fibrosis qu¨ªstica), y como no mendelianas, aquellas relacionadas con muchos (por ejemplo, la hipertensi¨®n).
Ahora bien, la secuencia de un mismo gen puede cambiar en cada persona y esto modifica asimismo sus caracteres (altura, susceptibilidad a hipertensi¨®n, etc.). Lo ideal, entonces, no es simplemente emparejar genes a caracteres, sino asociar secuencias concretas ¨Cvariantes de un mismo gen¨C a la magnitud de los mismos. Si obtuvi¨¦ramos esta relaci¨®n alcanzar¨ªamos dos objetivos. El primero es que entender¨ªamos mejor el fundamento biol¨®gico de esa propiedad. El segundo es que podr¨ªamos predecirla en aquellos individuos que presentaran la secuencia especifica identificada. Ambos aspectos contribuir¨ªan al desarrollo de la medicina personalizada.
Sin embargo, pese al abaratamiento de la secuenciaci¨®n (en el a?o 2000 eran unos 300 millones de d¨®lares; hoy, 1.000 d¨®lares), secuenciar el genoma de muchas personas ¨Clo cual es necesario para poder hacer la asociaci¨®n secuencia a car¨¢cter¨C es todav¨ªa complicado. Los experimentos GWAS (del ingl¨¦s, genome-wide association studies) ofrecen una alternativa: secuenciar exclusivamente las regiones del genoma en las que se exhibe el tipo de variabilidad gen¨¦tica m¨¢s frecuente. Estas regiones se llaman SNPs (del ingl¨¦s single nucleotide polymorphisms) y solo contienen un nucle¨®tido, el constituyente b¨¢sico del genoma, que puede presentar cuatro estados diferentes, abreviados G, A, T, C.
La variaci¨®n en un SNP no tiene por qu¨¦ ser la causa de la presencia, o modificaci¨®n, de la propiedad biol¨®gica correspondiente. Los SNPs act¨²an en la mayor¨ªa de los casos como ¡°se?alizadores¡± de la existencia, cercana f¨ªsicamente en el genoma de variantes gen¨¦ticas que s¨ª son las aut¨¦nticas causas. Esto es debido al ¡°ligamiento¡± que existe entre secuencias cercanas f¨ªsicamente en el genoma humano, conocido como desequilibrio de ligamiento.
Mediante metodolog¨ªas especiales para examinar estas regiones, m¨¢s baratas y f¨¢ciles, se pueden evaluar en torno a un mill¨®n de SNPs por individuo. Sin embargo, los primeros trabajos fueron incapaces de identificar los conjuntos de SNPs vinculados a la variabilidad encontrada en los caracteres complejos o en la susceptibilidad a enfermedades no mendelianas. Para nuestro asombro, parece que la mayor¨ªa de los aspectos propios de la biolog¨ªa humana est¨¢n determinados por much¨ªsimos m¨¢s SNPs y con una influencia mucho m¨¢s d¨¦bil de los que esper¨¢bamos. Estos SNPs aparecen distribuidos adem¨¢s por todo el genoma.
Por otro lado, desde la secuencia del genoma a la manifestaci¨®n del aspecto biol¨®gico existen niveles intermedios de actividad molecular, que modulan la posible expresi¨®n de ese aspecto, lo que complica m¨¢s a¨²n el entendimiento de esta relaci¨®n. Esto ¨²ltimo se conoce como el problema del mapa genotipo-fenotipo.
Y es aqu¨ª donde entran las matem¨¢ticas. El impulso de m¨¦todos cuantitativos permite entender mejor la asociaci¨®n entre secuencia y car¨¢cter biol¨®gico, incorporando informaci¨®n del contexto molecular y celular, en forma de redes gen¨¦ticas. Por ejemplo, estas t¨¦cnicas hacen posible identificar SNPs cuya variaci¨®n se asocia significativamente con la susceptibilidad frente a una enfermedad. Entre estas herramientas encontramos modelos simples de regresi¨®n y metodolog¨ªas m¨¢s complejas que incorporan estimaci¨®n bayesiana y, m¨¢s recientemente, el uso de redes neuronales profundas e inferencia causal.
En cuanto al segundo objetivo que expon¨ªamos, el de la predicci¨®n, las matem¨¢ticas se emplean para desarrollar sistemas que vaticinen el valor de un car¨¢cter dado a partir de informaci¨®n de la secuencia individual. Para ello se est¨¢ agregando toda la informaci¨®n de los SNPs disponibles, teniendo en cuenta la intensidad de su efecto, en un ¨²nico ¡°predictor¡± de riesgo polig¨¦nico. A medida que mejora su capacidad de pron¨®stico, muchos proponen su uso como biomarcadores independientes y para la clasificaci¨®n de la gravedad de los pacientes. Sin embargo, tambi¨¦n tienen limitaciones: nuestro entendimiento del funcionamiento de estos predictores es muy reducido, dado lo enmara?ado del mapa genotipo-fenotipo descrito. Adem¨¢s, su desarrollo depende de la poblaci¨®n concreta bajo examen (y de las interacciones dependientes del ambiente entre genes) y es as¨ª dif¨ªcilmente generalizable.
Los predictores de riesgo polig¨¦nico representan entonces un ejemplo m¨¢s ¨Cen gen¨®mica¨C de los desaf¨ªos a los que se enfrentan otras disciplinas cuyo objetivo es la predicci¨®n cuantitativa a partir del llamado big data. Estas herramientas desempe?an su labor, pero no percibimos bien el porqu¨¦. Warren Weaver, uno de los pioneros de la teor¨ªa de la informaci¨®n, resalt¨® en su escrito sobre Ciencia y Complejidad (de 1947) que este tipo de desaf¨ªos, a los que denomin¨® de complejidad ¡°organizada¡±, ser¨ªan los que dominar¨ªan la ciencia y tecnolog¨ªa futura. Profundizar en ellos mediante el uso de las matem¨¢ticas marcar¨¢ sin ninguna duda el avance y ¨¦xito de la codiciada medicina personalizada, pero deber¨ªamos siempre tener presente las restricciones ineludibles que impone la complejidad.
Juan F. Poyatos dirige el laboratorio de L¨®gica de los Sistemas Gen¨®micos en el Centro Nacional de Biotecnolog¨ªa, integrado en la conexi¨®n LifeHUB del Consejo Superior de Investigaciones Cient¨ªficas, y es investigador visitante del ICMAT.
Caf¨¦ y Teoremas es una secci¨®n dedicada a las matem¨¢ticas y al entorno en el que se crean, coordinado por el Instituto de Ciencias Matem¨¢ticas (ICMAT), en la que los investigadores y miembros del centro describen los ¨²ltimos avances de esta disciplina, comparten puntos de encuentro entre las matem¨¢ticas y otras expresiones sociales y culturales y recuerdan a quienes marcaron su desarrollo y supieron transformar caf¨¦ en teoremas. El nombre evoca la definici¨®n del matem¨¢tico h¨²ngaro Alfred R¨¦nyi: ¡°Un matem¨¢tico es una m¨¢quina que transforma caf¨¦ en teoremas¡±.
Edici¨®n y coordinaci¨®n: ?gata A. Tim¨®n G Longoria (ICMAT).
Puedes seguir a MATERIA en Facebook, Twitter e Instagram, o apuntarte aqu¨ª para recibir nuestra newsletter semanal.