Hacia una 'web' que entienda al usuario
Cient¨ªficos espa?oles trabajan en un proyecto europeo de red sem¨¢nticacon bases de datos de biomedicina
Cu¨¢ntas veces uno desear¨ªa que el ordenador dijera: "Ya entiendo lo que quieres decir"? Muchas, especialmente cuando se trata de buscar informaci¨®n en la world wide web (la red de las tres w: www) y uno no tiene claro qu¨¦ palabra exactamente producir¨¢ el resultado deseado. Entonces, ser¨ªa estupendo que los ordenadores tuvieran una cierta capacidad de comprensi¨®n, que reaccionaran correctamente ante el sentido figurado de un t¨¦rmino y que no exigieran precisar todas las condiciones de b¨²squeda para dar el resultado. Si los ordenadores logran dialogar entre s¨ª sobre el significado de la informaci¨®n que tienen, la web dar¨¢ un salto cualitativo hacia un sistema m¨¢s eficaz en el intercambio global de datos.
La tecnolog¨ªa se ensayar¨¢ en sistemas de emergencia en cat¨¢strofes
Los ordenadores podr¨¢n pedirse explicaciones mutuamente
Este paso adelante de la web est¨¢ ya en el horizonte, y una tecnolog¨ªa que debe de hacerlo posible es la llamada web sem¨¢ntica, ¨¢rea en la que investigan desde hace unos a?os expertos en todo el mundo. En Europa, acaba de arrancar un nuevo proyecto internacional sobre web sem¨¢ntica denominado OpenKnowledge. Cuenta con una financiaci¨®n de cuatro millones de euros del Programa Marco europeo y, bajo la coordinaci¨®n de Dave Robertson (Universidad de Edimburgo), participan en ¨¦l destacados investigadores de varios pa¨ªses, incluido el f¨ªsico brit¨¢nico Tim Berners-Lee, inventor de la world wide web en la d¨¦cada de los ochenta. Por parte espa?ola integran OpenKnowledge especialistas del Consejo Superior de Investigaciones Cient¨ªficas (CSIC), coordinados por Marco Schorlemmer, del Instituto de Investigaci¨®n de Inteligencia Artificial (IIIA), en Barcelona.
"Ahora, en la web todos tenemos que utilizar los mismos t¨¦rminos o la comunicaci¨®n falla", explica Schorlemmer. "Pero si las m¨¢quinas tuvieran capacidad de hablar entre s¨ª de igual a igual, con un protocolo que permitiera a los ordenadores pedirse aclaraciones -'esto no lo entiendo, expl¨ªcamelo'- la comunicaci¨®n entre ellos mejorar¨ªa. Si las m¨¢quinas tienen capacidad de entablar este di¨¢logo pueden manejar la informaci¨®n por contenidos sem¨¢nticos pr¨®ximos y no s¨®lo por contenidos l¨¦xicamente iguales". Esta es la idea b¨¢sica de la web sem¨¢ntica.
Para que los ordenadores logren esta comprensi¨®n mutua, es preciso que los datos en la web lleven meta-informaci¨®n, datos adicionales a los visibles, y en el desarrollo de la web sem¨¢ntica se est¨¢ haciendo mucho esfuerzo en una codificaci¨®n del lenguaje que permita a las m¨¢quinas procesarla.
En realidad, un buscador como el popular Google est¨¢ ya muy bien, es capaz de encontrar las palabras clave que se le introducen como criterio de b¨²squeda en millones de documentos. ?Entonces, qu¨¦ debe de aportar de nuevo la web sem¨¢ntica al usuario? "Mejores b¨²squedas de informaci¨®n, mejor enfocadas, mejor seleccionadas por su relevancia y con resultados m¨¢s precisos", responde Ram¨®n L¨®pez de M¨¢ntaras, director adjunto del IIIA. Y pone un caso sencillo: "Se podr¨¢ buscar en la red, por ejemplo, con el criterio de 'pel¨ªculas que traten de tal o cual contenido' y no necesariamente por el nombre exacto de la pel¨ªcula o del director".
Hay que tener en cuenta que un buen programa buscador presenta los resultados de una consulta con un cierto orden, pero establecido con datos estad¨ªsticos -como el mayor n¨²mero de consultas de una p¨¢gina o las veces que contiene la palabra buscada- y no porque entienda la pregunta.
"La mayor parte de los contenidos de la web esta dise?ada para que los humanos la lean, no para que la manipulen programas de ordenador con sentido", escrib¨ªa Berners-Lee en Scientific American. "La web sem¨¢ntica proporcionar¨¢ estructura al significado del contenido de las p¨¢ginas web, creando un entorno en el que los agentes de software, rastreando de p¨¢gina en pagina, puedan realmente realizar funciones avanzadas para los usuarios".
Schorlemmer pone un ejemplo: "Uno puede buscar con Google 'im¨¢genes de personas riendo', y obtendr¨¢ como resultado much¨ªsimas entradas. Pero el sistema no sabe que debe incluir 'mujeres contentas' o 'ni?os contentos', que son una subclase de personas. Esto es lo que debe hacer la web sem¨¢ntica". Para ello hay que crear y adjuntar a la informaci¨®n esa informaci¨®n adicional de forma estandarizada que las m¨¢quinas puedan manejar. La estructura de di¨¢logo entre ordenadores de igual a igual es una clave del desarrollo, es decir, que las m¨¢quinas puedan proporcionar y recabar informaci¨®n en un di¨¢logo constante y no, como ahora en su mayor¨ªa, con unas que solicitan la informaci¨®n -de parte del usuario- a otras que la tienen.
Los entusiastas de la web sem¨¢ntica no dudan de que supondr¨¢ un gran salto cualitativo, pero eso no significa decir que los millones de usuarios de la web se vayan a encontrar de repente con un sistema de uso radicalmente nuevo. "No ser¨¢ una web diferente de utilizar y se implantar¨¢ poco a poco", explica Schorlemmer. "Sobre la tecnolog¨ªa actual se ir¨¢ poniendo en marcha la nueva capa de la red sem¨¢ntica y ambas, la actual y la nueva, convivir¨¢n".
Esta nueva forma de comunicaci¨®n en la red va mas all¨¢: no se trata s¨®lo de mejorar la capacidad de comprensi¨®n de las m¨¢quinas y de facilitar la cooperaci¨®n entre ellas y los usuarios. Tambi¨¦n se vislumbra un nuevo horizonte de conocimiento que surja de la integraci¨®n completa de contenidos de documentos y datos.
Uno de los objetivos concretos de OpenKnowledge, en el que se centra el grupo espa?ol, combina los enfoques de la computaci¨®n con la biomedicina. Se trata de mejorar, en colaboraci¨®n con cient¨ªficos del Instituto de Investigaciones Biom¨¦dicas (CSIC), la capacidad de las m¨¢quinas para compartir informaci¨®n de secuencias gen¨¦ticas y prote¨®micas que tienen los laboratorios, comenta Schorlemmer. Aunque esas secuencias est¨¦n disponibles en la web actual, la explotaci¨®n que se hace es limitada porque mucha informaci¨®n generada en los laboratorios no se introduce en bases de datos centralizadas y se desecha. "Las tecnolog¨ªas que se desarrollar¨¢n en OpenKnowledge facilitar¨¢n el hacer que esa informaci¨®n sea asequible a otros laboratorios a trav¨¦s de la interacci¨®n en una red descentralizada entre iguales", contin¨²a. Las tecnolog¨ªas que se desarrollen en el programa se ensayar¨¢n en bases de datos de biomedicina en laboratorios de Barcelona y de Edimburgo, por una parte, y en sistemas de emergencia en cat¨¢strofes, como los terremotos.
"El gran reto de la web sem¨¢ntica es proporcionar un lenguaje que exprese tanto los datos como las reglas de razonamiento sobre los datos y que permita la exportaci¨®n a la web de las reglas de cualquier sistema existente de representaci¨®n del conocimiento", ha explicado Berners-Lee. Y recuerda: "El objetivo es crear un medio universal de intercambio de datos que puedan ser compartidos y procesados tanto por herramientas autom¨¢ticas como por personas".

Tu suscripci¨®n se est¨¢ usando en otro dispositivo
?Quieres a?adir otro usuario a tu suscripci¨®n?
Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.
FlechaTu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.
?Tienes una suscripci¨®n de empresa? Accede aqu¨ª para contratar m¨¢s cuentas.
En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.