Las fascinantes dificultades del genoma humano
Los cient¨ªficos intentan descifrar la informaci¨®n contenida en la mol¨¦cula de la herencia
La publicaci¨®n en febrero de 2001 de las letras del genoma humano fue s¨®lo el principio de la labor. Era un borrador en el que los cient¨ªficos siguen encontrando errores, quedaba una parte que no hab¨ªa sido secuenciada y faltaba la interpretaci¨®n de la informaci¨®n. Matem¨¢ticas y computadoras, unidas en la bioinform¨¢tica, ayudan ahora en ese trabajo.
'No sabemos a¨²n el n¨²mero de genes, quiz¨¢s s¨®lo conocemos entre el 70% y el 80%'.
E l an¨¢lisis de la informaci¨®n contenida en el genoma humano est¨¢ resultando m¨¢s dif¨ªcil de lo que se pensaba. Pero los cient¨ªficos est¨¢n encantados con un momento de la investigaci¨®n biol¨®gica que describen como 'fascinante'. Cada etapa del an¨¢lisis del genoma desvela problemas muy complejos. Y al mismo tiempo se abre la puerta a retos nuevos, como el de desentra?ar las decenas de miles de interacciones entre las prote¨ªnas en una c¨¦lula. 'Esto ha sido el sue?o de la biolog¨ªa, y por primera vez parece posible', dice Alfonso Valencia, del Centro Nacional de Biotecnolog¨ªa (CNB) y co-organizador del congreso sobre bioinform¨¢tica celebrado la semana pasada en la Fundaci¨®n BBVA, en Madrid.
'Una cosa es secuenciar el genoma y otra encontrar las variaciones entre personas; necesitas secuencias de calidad suficiente para distinguir los errores de lo que son realmente variaciones. Luego hay que encontrar los genes, y sus variaciones; y hay que saber qu¨¦ hace la prote¨ªna que sintetiza ese gen, y c¨®mo se relaciona con las dem¨¢s prote¨ªnas. Todo este trabajo se desarrolla en paralelo. Hay grupos trabajando en cada cosa', dice Valencia.
Pavel A. Pevzner (Universidad de California, en San Diego) desarrolla ensambladores, programas inform¨¢ticos que montan las secuencias de genoma sueltas, como si armaran un rompecabezas. Para explicar el funcionamiento de su ensamblador, llamado Euler, Pevzner hace referencia a problemas matem¨¢ticos cl¨¢sicos como el de los siete puentes o el del viajante. Hoy existen varios ensambladores, pero seg¨²n Pevzner ninguno es capaz de resolver un 5% del genoma que a¨²n falta por secuenciar. 'Costar¨¢ mucho m¨¢s ensamblar este 5% que el 95% restante', dice. Y en algunas de las regiones que faltan se sabe que hay genes relacionados con enfermedades. 'Para ensamblar estas regiones ser¨¢ necesario desarrollar un nuevo algoritmo. Es tan dif¨ªcil porque son regiones muy repetitivas y no hay puntos de referencia. Pasa con los rompecabezas: los de dibujo variado son f¨¢ciles de armar, pero es muy dif¨ªcil ensamblar un cielo', contin¨²a.
La identificaci¨®n de genes en la parte secuenciada tambi¨¦n 'va m¨¢s despacio de lo que estimamos al principio', dice Roderic Guig¨®, del Institut Municipal d'Investigaci¨® M¨¨dica, en Barcelona, y coorganizador del congreso. Aunque se sabe que el n¨²mero de genes ronda los 33.000, 'no sabemos a¨²n el n¨²mero preciso, quiz¨¢s s¨®lo conocemos entre el 70% y el 80%'. Y de ellos, 's¨®lo de unos 10.000 sabemos c¨®mo son realmente'. La cosa se enrevesa a¨²n m¨¢s al constatarse la ca¨ªda de lo que hasta hace poco era un dogma en biolog¨ªa: que a un gen corresponde la s¨ªntesis de una ¨²nica prote¨ªna. 'Vemos que la mayor parte de genes codifican para m¨¢s de una prote¨ªna. Y por ahora s¨®lo sabemos para muy pocos genes el patr¨®n completo de prote¨ªnas que producen', se?ala Guig¨®.
Una vez identificado un gen y la prote¨ªna que sintetiza, hay que conocer la estructura de esas prote¨ªnas; es decir, los investigadores saben la hilera de amino¨¢cidos que componen las prote¨ªnas, pero no c¨®mo se pliegan para que la prote¨ªna adquiera su forma tridimensional. Es importante porque la forma de una prote¨ªna determina su interacci¨®n con otras y por tanto su funci¨®n. Y el problema est¨¢ en que no se conoce o no hay una f¨®rmula con la que traducir ristras de amino¨¢cidos en plegamientos. A falta de ella se recurre a estrategias indirectas, como comparar las secuencias hu¨¦rfanas de estructura con otras de estructura conocida, almacenadas en bases de datos.
Tambi¨¦n este problema resulta m¨¢s complejo de lo esperado. Antes se cre¨ªa que si se resolviera la estructura de 10.000 prote¨ªnas distintas se tendr¨ªa una representaci¨®n de todas las familias, los grandes tipos, de formas. Pero no. Seg¨²n Valencia, se cree que hay unas 100.000 prote¨ªnas en que la relaci¨®n entre su secuencia y su estructura no se parece a ninguna otra.
A la hora de determinar la funci¨®n de las prote¨ªnas el problema es similar. 'Estamos viendo que deducir la funci¨®n a partir de la estructura es muy complicado', dice Valencia. 'Estructuras parecidas pueden hacer cosas muy distintas, y esto complica mucho la predicci¨®n'. Su grupo ha calculado cu¨¢ntos errores se pueden cometer al asumir que estructuras parecidas implican funciones parecidas. Les sale que a m¨¢s del 40% de similitud de secuencia se conserva s¨®lo el 60% de parecido de funci¨®n. Otros grupos han hecho el mismo c¨¢lculo y el resultado oscila entre conservaci¨®n del 30% del parecido y el 80%.
Pero el gran tema del momento es el de las interacciones entre prote¨ªnas. Porque, de nuevo, una prote¨ªna ya no se asocia a una sola funci¨®n. Una misma prote¨ªna puede producir muerte o divisi¨®n celular, seg¨²n sus interacciones con otras prote¨ªnas. Conocer la red de interacciones no ser¨¢ f¨¢cil, pero es el sue?o de un bi¨®logo y empieza a vislumbrarse la posibilidad de cumplirlo.
Se estima que en una c¨¦lula de levadura cada prote¨ªna interacciona con otras seis o siete, lo que da unas 50.000 interacciones en un ciclo celular. Probablemente ser¨¢n m¨¢s en c¨¦lulas de seres pluricelulares. Hay ya diversos m¨¦todos para desentra?ar estas interacciones, y lo primero que muestran es que 'alrededor del 60% de los complejos que encontramos son nuevos, no ten¨ªamos ni idea de que esas prote¨ªnas estuvieran asociadas', dice Valencia.
Son m¨¦todos nuevos que cometen errores, pero bastan para deducir que lo que se sabe hoy sobre las rutas bioqu¨ªmicas en una c¨¦lula es una fracci¨®n ¨ªnfima de lo que ocurre realmente. 'Pero lo vamos a conocer. Ahora cada t¨¦cnica cubre una parte peque?a de las interacciones, pero entre todas pensamos que cubren el mapa completo. Es lo que se llama biolog¨ªa de sistemas: tenemos el mapa de interacciones y se trata de ver c¨®mo funciona en marcha, c¨®mo se mueve. Es un problema nuevo, fascinante y complejo', explica Valencia. Ya hay una gran base de datos de interacciones de prote¨ªnas propiedad de un consorcio p¨²blico canadiense, y otras dos bases m¨¢s peque?as en EE UU y en Italia. El grupo de Valencia participa en un proyecto europeo para crear otra.
Guig¨® comparte el entusiasmo, pero advierte: 'Ser capaz de reproducir interacciones celulares de una c¨¦lula eucariota no es cosa de a?os, sino de d¨¦cadas. Es la biolog¨ªa de todo un siglo'.
Un sector econ¨®mico cambiante
La complejidad del an¨¢lisis del genoma, ?est¨¢ teniendo repercusiones econ¨®micas en un sector en crecimiento explosivo hace dos a?os? 'Las empresas de gen¨®mica se inflaron a finales de los noventa porque hubo un boom respecto al provecho que las farmac¨¦uticas obtendr¨ªan a partir de la informaci¨®n del genoma en un plazo razonable', responde Alfonso Valencia. 'Quiz¨¢ no fuera realista, pero eso no quiere decir que no estemos en la ¨¦poca m¨¢s apasionante, econ¨®mica y cient¨ªficamente, de la biolog¨ªa. Las farmac¨¦uticas siguen invirtiendo much¨ªsimo en gen¨®mica'. El propio Valencia y su colega Roderic Guig¨® han creado una empresa de bioinform¨¢tica en Espa?a, lo mismo que otros de sus colegas. Seg¨²n Valencia, la gran mayor¨ªa de los asistentes al congreso investigan y tienen o participan en empresas. Pero seg¨²n Pavel A. Pevzner y Temple Smith, tambi¨¦n es cierto que las empresas pioneras en gen¨®mica, como Celera e Incyte, han tenido que reorientar su negocio. 'La base de datos de Incyte no contiene muchas diferencias respecto a la base de datos p¨²blica, de acceso gratuito. Hizo mucho dinero al principio, pero ni esta compa?¨ªa ni ninguna de las que han tratado de hacer dinero s¨®lo con los datos o con el software han tenido ¨¦xito', dice Smith. 'Incyte ha tenido algunos problemas ahora; Celera se dedica a la b¨²squeda de nuevos f¨¢rmacos; Double Quest acaba de salir del mercado. Lo que pasa es que en un sector que cambia tan r¨¢pido no es bueno invertir s¨®lo en software. Microsoft ha hecho dinero porque Word no ha cambiado mucho, pero en gen¨®mica se desarrollan ensambladores nuevos con estrategias nuevas de modo rapid¨ªsimo'.
Tu suscripci¨®n se est¨¢ usando en otro dispositivo
?Quieres a?adir otro usuario a tu suscripci¨®n?
Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.
FlechaTu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.
En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.