Un ordenador repartido por todo el mundo
Decenas de miles de computadores coordinados tratar¨¢n los datos del acelerador LHC
Decenas de miles de ordenadores personales almacenar¨¢n y analizar¨¢n los datos que producir¨¢n los experimentos del nuevo acelerador de part¨ªculas LHC, que empezar¨¢ a funcionar en 2007 en el Laboratorio Europeo de F¨ªsica de Part¨ªculas (CERN), junto a Ginebra. Ser¨¢n unos 14 petabytes de informaci¨®n al a?o, el equivalente a m¨¢s de 20 millones de CD, o el 1% de la cantidad anual de informaci¨®n producida en el mundo actualmente. Es algo sin precedentes y s¨®lo la computaci¨®n distribuida podr¨¢ con tal avalancha de datos y c¨®mputos. La soluci¨®n se llama Grid, es muy eficaz y barata en comparaci¨®n con los superordenadores, y se est¨¢ desarrollando en todo el mundo para m¨²ltiples aplicaciones futuras.
En Ginebra habr¨¢ 25.000 ordenadores personales sin pantalla ni teclado
El reto del Grid es tratar r¨¢pidamente ingentes cantidades de informaci¨®n
En concreto, el programa del LHC, que lleva la delantera, se denomina LCG y es una de las dos aplicaciones piloto de un programa m¨¢s amplio EGEE (Enabling Grids for E-science in Europe), financiado mayoritariamente por la UE con 32 millones de euros. La otra aplicaci¨®n piloto, m¨¢s atrasada en su desarrollo, se dedica a biomedicina. EGEE es un proyecto de cuatro a?os (2004-2007) en el que participan 27 pa¨ªses y que supone la ampliaci¨®n y profundizaci¨®n del anterior, Datagrid, liderado por el CERN, que se centr¨® en el prototipo del nuevo sistema.
El LCG tiene que lograr que el Grid funcione a gran escala, tiene que arrancar esa galaxia de ordenadores diferentes repartidos por todo el mundo y conectados a la m¨¢xima velocidad posible. "De hecho, el Grid ya funciona, y muy bien; ahora tiene que crecer", dice Fran?ois Grey, portavoz del Openlab del CERN, una iniciativa de colaboraci¨®n con empresas de inform¨¢tica para el Grid.
Las salas del centro de c¨¢lculo del laboratorio de Ginebra se est¨¢n ampliando para alojar bater¨ªas de ordenadores personales (sin monitor ni teclado, por supuesto). Ya hay 5.000 en las estanter¨ªas, "pero habr¨¢ 25.000 s¨®lo aqu¨ª, cuando el LHC empiece a funcionar, y unos 100.000 en todo el mundo", contin¨²a Grey.
Las pruebas de LCG han sido todo un ¨¦xito, incluso con comunicaci¨®n transatl¨¢ntica ultrarr¨¢pida, y en los ¨²ltimos meses, explica Gray, se est¨¢n haciendo ya simulaciones de lo que ser¨¢n los experimentos del acelerador. La comunicaci¨®n ultrarr¨¢pida es importante porque el reto del Grid es, m¨¢s que nada, mover las ingentes cantidades de informaci¨®n r¨¢pidamente de unos ordenadores a otros. "En realidad lo m¨¢s dif¨ªcil ha sido acordar est¨¢ndares", dice Grey, porque cada miembro del Grid utilizar¨¢ la m¨¢quina que tenga o que desee. La idea es aprovechar toda la capacidad de almacenamiento de datos y c¨¢lculo posible, distribuida por donde est¨¦. Es un avance revolucionario de la ya de por s¨ª revolucionaria World Wibe Web (www), que naci¨® precisamente en el CERN (inventada por Tim Berners-Lee) hace algo m¨¢s de una d¨¦cada. Pero si la www da acceso a informaci¨®n distribuida, el Grid distribuye tambi¨¦n la computaci¨®n y el almacenamiento de informaci¨®n.
En l¨ªneas muy generales, el LCG funcionar¨¢ as¨ª: los datos generados en los experimentos del acelerador (en 40 millones de colisiones de part¨ªculas por segundo) pasar¨¢n un primer filtro en los propios detectores y la informaci¨®n conservada (unas 100 colisiones por segundo, que sumar¨¢n esos 12 o 14 petabytes anuales de datos) se almacenar¨¢ en miles de unidades diferentes de centros de todo el mundo, que se ocupar¨¢n tambi¨¦n del proceso de datos, distribuyendo y compaginando tareas.
As¨ª, cuando un f¨ªsico -y ser¨¢n varios miles de cient¨ªficos los participantes en LHC- trabaje en el an¨¢lisis de los experimentos no necesitar¨¢ saber d¨®nde est¨¢n los datos ni qu¨¦ ordenadores los est¨¢n procesando, igual que cuando uno recaba informaci¨®n en la www no tiene que saber d¨®nde est¨¢ almacenada ni qu¨¦ ordenador se la proporciona. "El truco es virtualizar todos los recursos", comenta Manuel Delfino, director del nodo espa?ol de este Grid.
"Grid es un conjunto de ordenadores paralelos y dispositivos interconectados que son heterog¨¦neos, pero que van a parecer homog¨¦neos desde el punto de vista del usuario", recuerda Vicky White, jefa de la Divisi¨®n de Computaci¨®n de Fermilab (Chicago, EE UU). Otras comunidades cient¨ªficas, como las de gen¨¦tica y prote¨®mica, que tambi¨¦n necesitan trabajar con enormes almacenes de informaci¨®n, se apuntan ya al Grid porque en sus aplicaciones potenciales "s¨®lo la imaginaci¨®n y la madurez tecnol¨®gica son ahora el l¨ªmite y en el futuro s¨®lo lo ser¨¢ la imaginaci¨®n", afirma Delfino.
El Grid y los supercomputadores no se hacen la competencia, sino que se complementan, explica Delfino, y el superordenador de Barcelona colaborar¨¢ en esta red. Hay problemas, como la modelizaci¨®n aeron¨¢utica, que exigen una veloc¨ªsima comunicaci¨®n entre procesadores, que son m¨¢s aptos para las supercomputadoras. Sin embargo, el Grid resuelve de maravilla los retos que suponen ingentes cantidades de informaci¨®n.
Nodo en Espa?a
Adem¨¢s del nodo cero del Grid LCG, ubicado en el CERN, hay otros 11 nodos en el proyecto y uno de ellos est¨¢ en Barcelona, en el reci¨¦n creado Puerto de Informaci¨®n Cient¨ªfica (PIC). "En cada uno de estos nodos se almacenar¨¢ casi toda la informaci¨®n del LHC y en ellos se realizar¨¢ bastante proceso de datos", explica Enrique Fern¨¢ndez, director del Instituto de F¨ªsica de Altas Energ¨ªas (IFAE). Por ahora est¨¢n instalados all¨ª m¨¢s de 200 ordenadores personales, pero cuando arranque el nuevo acelerador y empiecen a generarse las ingentes cantidades de datos, habr¨¢ unos mil. "Todo depende de la evoluci¨®n tecnol¨®gica", dice Manuel Delfino, director del centro de Barcelona. "Cada PC llevar¨¢ dos procesadores, as¨ª que tendremos el equivalente a 2.000 y con el doble de velocidad".
Al Grid no llegar¨¢n todos los registros generados en las colisiones de part¨ªculas del LHC porque el sistema tiene varios niveles de filtro, explica Fern¨¢ndez. El primero va asociado a los propios detectores pr¨¢cticamente como hardware y eliminar¨¢ la informaci¨®n que no interesa para la f¨ªsica. S¨®lo llegar¨¢n los datos de choques potencialmente interesantes.
Los grupos espa?oles colaboran en este Grid desde el principio. "Todos los que est¨¢n en el LHC participan en el desarrollo de Grid", comenta Fern¨¢ndez. El PIC, auspiciado por el IFAE, es un centro asociado del Ciemat, la Universidad Aut¨®noma de Barcelona, el Departamento de Investigaci¨®n de la Generalidad catalana y el IFAE.
Tu suscripci¨®n se est¨¢ usando en otro dispositivo
?Quieres a?adir otro usuario a tu suscripci¨®n?
Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.
FlechaTu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.
En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.