El laberinto del genoma
Hace diez a?os se completaba el primer genoma, el de una bacteria. Surgi¨® la euforia. Se completaron los de un gusano, el rat¨®n, el ser humano. En agosto, el del chimpanc¨¦, extraordinariamente parecido al nuestro. Hacemos balance: cuanto m¨¢s sabemos, vemos que m¨¢s ignoramos.
Madrid, Palacio de Congresos. Finales de septiembre de 2005. Tres investigadores -dos brit¨¢nicos y un espa?ol- toman asiento en un rinc¨®n tranquilo, lejos del barullo propio de un congreso que re¨²ne a m¨¢s de 800 cient¨ªficos de todo el mundo. Su intenci¨®n es explicar a un periodista, en t¨¦rminos sencillos, el asunto de la reuni¨®n: ?qu¨¦ se ha aprendido sobre el genoma humano en estos ¨²ltimos cuatro a?os, desde que en 2001 se public¨® su primer borrador casi completo? Pero, pese al esfuerzo de los tres investigadores, la conversaci¨®n es todo menos sencilla. Imposible que lo sea: en cuanto uno empieza a explicar algo, otro le pisa discrepando y el tercero se mete tomando partido, y ya la tenemos montada. Pasamos a una jerga con expresiones como "selecci¨®n positiva", "transcripci¨®n neutral", "tasa de vida-muerte"? Ewan Birney, del Laboratorio Europeo de Biolog¨ªa Molecular, reconocer¨¢ m¨¢s tarde: "Uf, a ver c¨®mo transmite esto a sus lectores". Mejor ni intentarlo. Pero el mensaje de fondo ha quedado clar¨ªsimo: entender la informaci¨®n comprimida en la mol¨¦cula de ADN humano, descodificar ese libro de la vida con las instrucciones para construir y hacer funcionar un individuo Homo sapiens, se ha convertido en un reto mucho m¨¢s dif¨ªcil de lo esperado. Y ahora el problema est¨¢ en plena fase servilleta, esa en que los investigadores en primera l¨ªnea de batalla no pueden dejar de darle vueltas y, cuando les viene una idea, la apuntan donde pillan. Lo que sigue es una cr¨®nica de la aventura de tratar de entender c¨®mo estamos hechos, en el sentido m¨¢s fundamental de la expresi¨®n.
Se han secuenciado los genomas de 1.500 especies, del arroz al perro y al humano. La vaca est¨¢ a punto
Hay muchos menos genes de lo esperado. ?C¨®mo es posible que un humano tenga casi los mismos que un gusano?
El resultado es desconcertante y obliga a replantear hasta el concepto de gen. Ahora las claves est¨¢n en las prote¨ªnas
"Tenemos el libro, y en el libro, efectivamente, est¨¢ toda la informaci¨®n, pero es que est¨¢ en ruso. Ahora estamos aprendiendo ruso de forma autodidacta. Tenemos que aprender la gram¨¢tica, las reglas", dice Birney. "S¨ª, pero el ruso est¨¢ resultando m¨¢s complicado de lo que cre¨ªamos", interviene Roderic Guig¨®, del Instituto Municipal de Investigaci¨®n M¨¦dica (IMIM), en Barcelona. No es que no se haya avanzado, ni mucho menos. De hecho, Birney prefiere ver "el vaso medio lleno", y describe su emoci¨®n "al ver c¨®mo poco a poco se van clarificando palabras enteras en el genoma". Pero cada paso adelante revela aspectos nuevos, algunos tan inesperados que obligan a replantear conceptos b¨¢sicos, como la definici¨®n de gen. "Hay muchas cosas que cre¨ªamos que entend¨ªamos, y estamos viendo que no es as¨ª", afirma el interlocutor de Birney y Guig¨®, Tom Gingeras, de la compa?¨ªa Affimetrix. Alfonso Valencia, director del Instituto Nacional de Bioinform¨¢tica (INB) y uno de los organizadores del reciente congreso de Madrid -la Conferencia Europea de Biolog¨ªa Computacional-, transmite la misma idea: "Estamos cambiando mucho el panorama de la biolog¨ªa molecular. Ahora, la sensaci¨®n de desaf¨ªo es enorme".
Lo primero que ha cambiado es que, por primera vez en la historia de la biolog¨ªa, empieza a estar disponible una enorme cantidad de datos sobre los elementos que intervienen a la hora de construir un organismo. Es una situaci¨®n m¨¢s propia, o lo ha sido hasta ahora, de las ciencias f¨ªsicas: en su af¨¢n por describir el mundo, por ejemplo, el clima, los f¨ªsicos toman cuantos m¨¢s datos mejor sobre todos los elementos que intervienen en ese sistema, y elaboran modelos que simulan y en cierto modo predicen su comportamiento. Pero nunca hasta ahora los bi¨®logos hab¨ªan so?ado con modelizar una c¨¦lula, y no digamos un organismo. Ahora s¨ª es un objetivo al menos planteable, y la raz¨®n es ¨¦sa, que empieza a haber muchos datos sobre los componentes m¨¢s b¨¢sicos del sistema y sus interacciones.
Esa acumulaci¨®n de informaci¨®n es un hecho palpable. Toma la forma de los ordenadores donde se guardan las tres principales colecciones de informaci¨®n gen¨¦tica en el mundo, los tres interconectados y accesibles por Internet. En esos grandes bancos digitales hay ya almacenados m¨¢s de 100.000 millones de bases, que son las letras qu¨ªmicas con que se escribe la informaci¨®n gen¨¦tica. Son letras de cuatro tipos, representadas con las siglas A, C, G y T. Los genomas son series de hasta miles de millones de estas letras -el humano tiene 3.000 millones-; hallar el orden en que se disponen las bases es lo que se entiende por secuenciar un genoma, y una secuencia es una determinada sucesi¨®n de bases. Hoy, cuando un bi¨®logo quiere saber algo de una secuencia cualquiera, sea perteneciente a una bacteria, una planta o cualquier organismo viviente, no tiene m¨¢s que consultar las grandes colecciones: le dir¨¢n si hay otras parecidas en otros organismos o qu¨¦ funciones se le atribuyen, por ejemplo.
Y eso gracias a que hoy, adem¨¢s de la secuencia completa del genoma humano, se conoce la de otros muchos seres. Los 100.000 millones de bases almacenadas en las colecciones proceden de los genomas de unas 200.000 especies, y de ellos, 1.500 han sido secuenciados completamente, o casi. Hay millares de virus, varios cientos de bacterias, insectos como el mosquito de la malaria o la mosca del vinagre, el peque?o gusano C. elegans, la modesta plantita Arabidopsis thaliana, el arroz? Y en cuanto a mam¨ªferos, estamos nosotros; nuestro pariente evolutivo m¨¢s cercano, el chimpanc¨¦ -reci¨¦n llegado a la lista de genomas completos, a finales de agosto-; el perro, el rat¨®n, la rata y el pollo. El de la vaca est¨¢ casi a punto.
Parecen muchos y, s¨ª, lo son, sobre todo teniendo en cuenta que el primer genoma completo de un organismo vivo, la bacteria Haemophilus influenzae, se public¨® hace s¨®lo diez a?os. El volumen de datos que est¨¢ produciendo el estudio de los genomas es ingente, hasta el punto de que los bioinform¨¢ticos creen que har¨¢n falta ordenadores especialmente dise?ados para gestionar y analizar la informaci¨®n biol¨®gica. Y sin embargo, 1.500 genomas secuenciados no son nada comparado con lo que hay en la naturaleza.
Las letras A, C, G y T han ido combin¨¢ndose de infinidad de maneras distintas desde que existe la vida. Y a veces con las nuevas combinaciones surgen nuevas instrucciones para construir organismos distintos, como si se generara una pieza diferente de Lego. Despu¨¦s, el ambiente -la famosa selecci¨®n natural- se encarga de decidir si la nueva pieza se diseminar¨¢ o no en la naturaleza: si confiere a quien la posee alguna ventaja, tal vez ese afortunado tenga m¨¢s hijos, que heredar¨¢n la nueva caracter¨ªstica, que se mantendr¨¢ por tanto en el acervo de piezas de Lego disponibles para construir seres vivos distintos. Como dijo Birney en el congreso de bioinform¨¢tica, "la evoluci¨®n es un experimento de gen¨¦tica a escala enorme". O un conjunto de piezas de Lego en permanente cambio a escala planetaria.
Craig Venter, apodado a finales del siglo pasado Zar de la gen¨¦tica por sus ideas rompedoras -y exitosas-, afirmaba recientemente en una entrevista a EL PA?S: "Ya tenemos una lista de 40.000 o 50.000 grandes familias distintas [de genes], y s¨®lo 5.000 de ellas est¨¢n presentes en el genoma humano y en el de los dem¨¢s mam¨ªferos. Esto es extraordinario: significa que no sabemos nada sobre nuestro propio planeta". Venter, que en su d¨ªa desarroll¨® una t¨¦cnica para secuenciar genomas mucho m¨¢s r¨¢pida de la que se ven¨ªa usando y que es la m¨¢s extendida hoy, se dedica ahora, tal como contaba EPS el domingo pasado en un amplio reportaje, a secuenciar genomas de microorganismos hallados en muestras de agua del mar, y dice haber encontrado ya ocho millones de genes nuevos.
?Se llegar¨¢ alg¨²n d¨ªa a tener todas las piezas de Lego creadas por la evoluci¨®n archivadas en las colecciones de datos gen¨¦ticos?
Ahora bien, la posibilidad de ir acumulando m¨¢s y m¨¢s informaci¨®n no es lo ¨²nico que ha cambiado en biolog¨ªa en los ¨²ltimos tiempos. Ese cambio ha tra¨ªdo otros fundamentales. Cambios en lo que se sabe sobre c¨®mo est¨¢ codificada la informaci¨®n en los genomas.
En los a?os cincuenta y sesenta se descubri¨® la estructura del ADN y el c¨®digo gen¨¦tico. Se supo entonces que en el n¨²cleo de todas y cada una de las c¨¦lulas del organismo el genoma se est¨¢ traduciendo en prote¨ªnas. Pero no todas las bases, todas las letras del genoma, se traducen; s¨®lo algunas que est¨¢n diseminadas a lo largo de toda la secuencia y que tienen un significado, como si en medio de la sopa de letras ACGTTGGAC? hubiera palabras escondidas. Esas palabras son los genes. Hasta ahora se ha considerado que los genes son realmente la aut¨¦ntica informaci¨®n con sentido del genoma, aunque constituyan apenas poco m¨¢s del 1% de todo el genoma. Al resto del genoma, que parece no tener sentido alguno, se le llam¨® "ADN chatarra" o incluso "ADN basura". "Si a un rat¨®n se le elimina del genoma una parte importante de su ADN chatarra, aparentemente vive bien, al menos en condiciones de laboratorio", explica Birney.
Con estos conceptos de partida, muchos investigadores que en torno al a?o 2000 se afanaban por secuenciar el genoma humano cre¨ªan que despu¨¦s bastar¨ªa con encontrar los genes, entender la funci¨®n de las prote¨ªnas en que ¨¦stos se traducen y? ?ya est¨¢! El libro de la vida, el manual de instrucciones de los humanos, ya estar¨ªa le¨ªdo y comprendido. Iba a ser un trabajo arduo, porque se estimaba que habr¨ªa entre 100.000 y 150.000 genes, pero era cosa de ponerse.
Sin embargo, ya desde febrero de 2001, cuando se public¨® el primer borrador, se vio que no iba a ser tan f¨¢cil. En primer lugar, porque parec¨ªa haber muchos menos genes de lo esperado, tal vez unos 30.000. ?C¨®mo era posible que un humano, tan complejo, tuviera casi los mismos genes que un gusano? Adem¨¢s se vio que no era cierto que cada gen ordenara la s¨ªntesis de s¨®lo una prote¨ªna. Un gen puede dar lugar a muchas m¨¢s prote¨ªnas.
Lo cierto es que hoy, cuatro a?os m¨¢s tarde, el panorama no se ha aclarado, sino todo lo contrario. No s¨®lo la escasez de genes y el hecho de que sean tan polifac¨¦ticos siguen sin respuesta. Adem¨¢s empieza a verse que la informaci¨®n encriptada en el genoma tiene varios planos de lectura, como un juego de videoconsola. En el m¨¢s bajo est¨¢ la, digamos, traducci¨®n directa de las letras qu¨ªmicas del genoma. Luego se pasa el segundo piso, definido por la relaci¨®n de los genes entre s¨ª: los genes forman redes de interacciones que afectan al resultado de la traducci¨®n. En un tercer nivel aparecen las prote¨ªnas -el producto generado en las etapas anteriores- y sus funciones en las c¨¦lulas. Como ocurri¨® con los genes, hoy se sabe que cada prote¨ªna no tiene una ¨²nica funci¨®n; tambi¨¦n ellas son polifac¨¦ticas. Y como no pod¨ªa ser menos, est¨¢n las interacciones entre prote¨ªnas. O sea, un laberinto de varias plantas con t¨²neles, trampas y ogro incluido.
"Pongamos que hay unas cinco veces m¨¢s prote¨ªnas que genes", explica Valencia. "Y las prote¨ªnas pueden sufrir decenas de modificaciones. Y en una c¨¦lula hay entre 150.000 y 500.000 prote¨ªnas, que interaccionan formando redes. Las combinaciones se multiplican".
Ya s¨®lo el primer piso del laberinto del genoma est¨¢ patas arriba con los resultados m¨¢s recientes. "A m¨ª lo que m¨¢s me sorprende es que haya tan pocos genes", dice Birney. "Gente como Roderic los ha buscado realmente a fondo, usando t¨¦cnicas que nadie usa por lo tediosas, y apenas han encontrado algunos m¨¢s de los que ten¨ªamos". Hoy, aunque sigue sin saberse con precisi¨®n el n¨²mero de genes humanos, est¨¢ claro que ronda los 20.000. Eso demuestra, por si quedaba alguna duda, que la clave de la cacareada complejidad humana no est¨¢ en el n¨²mero de genes.
A Guig¨®, por su parte, le maravilla el hecho de que un solo gen d¨¦ lugar a muchas prote¨ªnas. "Era un dogma en biolog¨ªa: un gen codifica para una prote¨ªna. Y en cambio vemos en el genoma de la mosca que un gen puede traducirse en m¨¢s prote¨ªnas que todo el genoma junto, unas 60.000". ?60.000 prote¨ªnas! "S¨ª, bueno, es un caso extremo", tranquiliza Birney. "Ya da bastante miedo que codifiquen para 50".
Pero lo ¨²ltimo de lo ¨²ltimo lo aporta el trabajo de Gingeras. Su grupo ha descubierto que no s¨®lo son los genes lo que se traduce del genoma. Los experimentos revelan que al menos dos veces m¨¢s letras que las que componen los genes son le¨ªdas por la maquinaria de traducci¨®n del genoma. Ahora bien, no son traducidas a prote¨ªnas. Y entonces, ?a qu¨¦? "No lo sabemos", responde Gingeras. Ni siquiera se sabe si esta informaci¨®n que al menos se lee sirve para algo o no. "Tal vez las verdaderas unidades con sentido, los ¨¢tomos del genoma, por as¨ª decir, son estos fragmentos, y no los genes. Tal vez estos fragmentos tienen tanta importancia como los genes, y, por tanto, en realidad tenemos cientos de miles de genes".
Es un resultado desconcertante que obliga a replantear el concepto de gen -y el que m¨¢s anim¨® la conversaci¨®n entre Gingeras, Birney y Guig¨®-. Y tiene otra consecuencia m¨¢s: que el famoso ADN chatarra, que es como hasta hoy se han considerado los fragmentos descubiertos por Gingeras, es probablemente m¨¢s importante de lo que se cre¨ªa. Es algo que muchos sospechaban, y de hecho est¨¢ la idea de que el ADN chatarra es en realidad un banco de pruebas del genoma, un ¨¢rea en la que pueden aparecer combinaciones nuevas sin demasiado riesgo, ya que lo m¨¢s probable es que no vayan a ser traducidas. "Lo que est¨¢ claro", dice Birney, "es que aqu¨ª est¨¢ pasando algo que no estamos viendo".
No hay que desesperar. En el laberinto del genoma humano hay gu¨ªas que ayudan mucho a orientarse. Son nada menos que los genomas secuenciados de otros organismos. Y es que la evoluci¨®n, en su proceso de crear, reciclar, eliminar nuevos genes -o lo que sean las unidades funcionales del genoma, las piezas de Lego-, ha ido dejando pistas. Pistas que los bi¨®logos encuentran comparando entre s¨ª los genomas de distintos organismos. Los detalles del trabajo no son f¨¢ciles, pero hay principios generales que s¨ª. Por ejemplo, si una determinada secuencia se conserva en muchos genomas, se puede pensar que su papel es importante: la evoluci¨®n ha eliminado los cambios que hayan podido aparecer en ella -tal vez las mutaciones han resultado letales para quienes las tuvieron.
Esa comparaci¨®n es posible por algo muy sorprendente para los no especialistas: los genomas de organismos muy distintos se parecen mucho entre s¨ª. "Para un genetista de rat¨®n, nosotros somos ratones sin rabo", dice Birney. El 99% de los genes del rat¨®n tienen un equivalente en el genoma humano, a pesar de que el genoma de rat¨®n es un 14% m¨¢s peque?o. Y eso por no hablar del parecido con nuestro hermano el chimpanc¨¦. "Yo me parezco m¨¢s a un chimpanc¨¦ macho que a una mujer", dice Guig¨®. Y no hay connotaciones extra?as, sino un cromosoma Y. Dejando de lado la cuesti¨®n del sexo, la diferencia entre el genoma de un chimpanc¨¦ macho y un hombre es diez veces superior a la que hay entre dos hombres.
Los chimpanc¨¦s y nosotros llevamos seis millones de a?os evolucionando por separado, y a pesar de eso compartimos casi el 99% de la secuencia b¨¢sica del ADN. Tambi¨¦n es cierto que se han identificado regiones en las que la tasa de cambios es distinta: mientras que en el humano muestran huellas de una evoluci¨®n acelerada -muchos cambios recientes-, en los chimpanc¨¦s parecen estar inactivas o fragmentadas. Tal vez ah¨ª residan las diferencias principales. Pero, para muchos, lo m¨¢s probable es que a¨²n no sepamos ver lo importante. "Puede que la respuesta a qu¨¦ nos hace humanos no est¨¦ en la secuencia del genoma, sino en la manera en que la usamos", dice Gingeras. "Tal vez nosotros escogimos un conjunto diferente de las prote¨ªnas que pueden generar los mismos genes".
La conclusi¨®n es que a¨²n queda trabajo para rato. Y puede que lo m¨¢s duro sea constatar que ni siquiera el genoma determina lo que somos, porque est¨¢ el papel del ambiente: la dieta, que a los padres les guste leer, el h¨¢bito de fumar?
Al laberinto gen¨®mico hay que a?adir una planta m¨¢s, tan dif¨ªcil como las otras. Es la mezcla de todos esos niveles de informaci¨®n lo que acaba determinando si tendremos c¨¢ncer, si veremos la vida con optimismo o si nos gustar¨¢ el color rojo o preferiremos el azul.
Tu suscripci¨®n se est¨¢ usando en otro dispositivo
?Quieres a?adir otro usuario a tu suscripci¨®n?
Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.
FlechaTu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.
En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.