"El poder de la gente siempre ha estado presente en las b¨²squedas"
El director del centro de investigaci¨®n en Europa del portal estadounidense resalta el valor de la informaci¨®n que generan los internautas para mejorar el funcionamiento de los buscadores
Las b¨²squedas que cada d¨ªa realizan millones de personas a trav¨¦s de Yahoo! se traducen al final de la jornada en unos 500 millones de registros. Analizarlos es fundamental para entender c¨®mo nos movemos en la Red e intentar mejorar con ello los buscadores, tarea que ocupa el trabajo de Ricardo Baeza-Yates, director de grupo de investigaci¨®n de Yahoo! en Europa, que ayer particip¨® en la conferencia sobre Web 2.0 que ayer se celebr¨® en Madrid.
“Lo que hace la gente con el contenido es lo que realmente vale”, afirma Baeza-Yates en una charla poco despu¨¦s de su intervenci¨®n en el evento que ha tra¨ªdo a Madrid a los fundadores de Del.ico.us y Flickr. El director de Yahoo! Research en el laboratorio de Barcelona est¨¢ convencido de que el an¨¢lisis del comportamiento frente a las p¨¢ginas de resultados es clave para mejorar los buscadores.
El investigador chileno, que ha trabajado tambi¨¦n para la Universidad de Chile y la Pompeu Fabra, se dedica a la “miner¨ªa de datos en Internet, el an¨¢lisis de contenido, de los enlaces y el comportamiento en la web. El objetivo, afirma, es “permitir que partiendo de la informaci¨®n impl¨ªcita que hay en las p¨¢ginas podamos ayudar a la gente” a encontrar m¨¢s f¨¢cilmente lo que busca.
El poder de la gente
Para alcanzar esa meta lo mejor es prestar atenci¨®n al comportamiento de los internautas. “El poder de la gente siempre ha estado presente en las b¨²squedas, aunque se ha producido una evoluci¨®n”, se?ala antes de explicar que si en un principio lo importante era el texto que hab¨ªa en una p¨¢gina -era lo que preocupaba a un buscador como Altavista-, luego lleg¨® con Google la importancia de los enlaces, que es ya un comportamiento humano, y luego hubo buscadores que se empezaron a fijar en lo que hace la gente.
“El elemento humano sigue siendo necesario en los buscadores, la gente es mucho mejor que la tecnolog¨ªa, quiere participar, aportar conocimiento, y hay que lograr aprovechar todas las fuentes de informaci¨®n humana”.
En la actualidad los buscadores deben tener presentes muchos elementos, como las etiquetas o palabras clave con que los internautas marcan los contenidos, los comentarios y votos que emiten. Informaci¨®n que junto al texto o los enlaces puede resultar vital a la hora de determinar cu¨¢l es el contenido o la importancia de una p¨¢gina. “Los buscadores integran todos estos criterios para dar el peso exacto a cada web, pero hay que encontrar un equilibrio que permita dar resultados relevantes y que al tiempo el buscador sea resistente a la manipulaci¨®n que puede llegar por a trav¨¦s del spam”.
Inteligencia colectiva contra el spam
Se refiere el jefe de investigaci¨®n de Yahoo! a p¨¢ginas que, conociendo algunos de los factores que utilizan los buscadores para valorar las webs, y los utilizan en su propio beneficio. As¨ª, se crean por ejemplo cientos de p¨¢ginas que contienen enlaces a otra que se quiere promocionar, creando la falsa sensaci¨®n para los buscadores de que esa web es muy popular -lo que la situar¨¢ en lo m¨¢s alto de las listas de resultados- porque muchas p¨¢ginas la vinculan. Contra ello, el “poder de la gente” tambi¨¦n es efectivo.
“El spam en buscadores es muy grande, pero lo que est¨¢ haciendo la gente en la Web 2.0, opinando y calificando contenidos, nos ayuda a determinar qu¨¦ es spam. No es lo mismo hacer algo ilegal en la calle, donde puede verte alguna persona, que hacer algo malo en Internet, donde todo el mundo est¨¢ mirando. Es positivo y nos ayuda”.
No se puede tratar igual a todas las p¨¢ginas
La participaci¨®n de los internautas en la elaboraci¨®n de contenidos para la web no es el ¨²nico ingrediente que marca esta ¨¦poca de Internet que se ha dado en llamar Web 2.0. Destaca tambi¨¦n la presencia de contenidos audiovisuales y p¨¢ginas muy gr¨¢ficas y din¨¢micas, el rich media, que plantea nuevos desaf¨ªos para los buscadores.
“Uno no puede indexar todos los sitios igual, no tiene el mismo peso un comentario en un blog que en un medio tradicional, hay factores temporales y tem¨¢ticos que hay que tener en cuenta”, explica Baeza-Yates. “Cada medio tiene su forma especial de ser recolectado y valorado, bas¨¢ndose tanto en el contenido como en los enlaces que hay en el contenido y lo que la gente hace. Uno aprende a detectar casi de forma autom¨¢tica las mejores fuentes de informaci¨®n que permiten detectar lo m¨¢s relevante”.
Sobre la b¨²squeda de v¨ªdeos e im¨¢genes, actualmente basada fundamentalmente en la interpretaci¨®n de los textos que acompa?an a estos archivos, el experto en b¨²squedas se?ala que en el futuro deber¨ªa utilizarse "un sistema m¨¢s integrado en el que tambi¨¦n se tenga en cuenta el contenido". Podemos utilizar el procesamiento autom¨¢tico de los v¨ªdeos para encontrar alg¨²n atributo que pueda ser ¨²til a la gente. Es algo que existe, pero lo dif¨ªcil es hacerlo de forma masiva: uno puede buscar en unos cuantos cientos de miles de v¨ªdeos, pero no en decenas de millones. Es un tema de escala”.
Tu suscripci¨®n se est¨¢ usando en otro dispositivo
?Quieres a?adir otro usuario a tu suscripci¨®n?
Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.
FlechaTu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.
En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.