Powerset y Hakia: los 'david' de la b¨²squeda
POWERSET.COM es una de las novedades de las que m¨¢s se hablan porque toma el problema de la b¨²squeda de manera diferente. En vez de fijarse en palabras clave sin necesaria relaci¨®n entre s¨ª, pretende entender tanto el sentido de las preguntas como el de las frases que va indexando (la t¨¦cnica se llama procesamiento de lenguajes naturales).
Lo m¨¢s impresionante para quien no es ingeniero es que la porci¨®n de texto marcada en las respuestas muchas veces contiene palabras que no figuraban en la pregunta. Por ejemplo a la pregunta "what politicians were killed by a disease?" (?Qu¨¦ pol¨ªticos murieron por una enfermedad?, Powerset da, entre otras respuestas "Hughes Fraser died from lung cancer" (Fraser muri¨® por c¨¢ncer de pulm¨®n). Entiende que Hugues era un pol¨ªtico y que "ser matado" y "morir" tienen significados similares. Su indexaci¨®n no se limita a las palabras, busca su significado, analiza el contexto, considera los sin¨®nimos.
La b¨²squeda por voz 1-800-GOOG-411 que prepara Google informa sobre comercios locales. Deber¨¢ permitir la b¨²squeda vocal
Es muy temprano para saber si Powerset, Hakia, Snap o ChaCha pueden ganarle a Google. Sin embargo dan resultados a veces mejores, pese a que est¨¢n empezando.
Scott Prevost, uno de sus dirigentes, anuncia que una vez terminado para el ingl¨¦s (anuncian la salida para septiembre) desarrollarlo para otros idiomas ser¨¢ cuesti¨®n de meses.
Powerset cuenta con una patente de Xerox Parc que "permite a las computadoras entender el sentido de los lenguajes humanos". Los ingenieros presentes se quedaron bastante impresionados y Ero Carrera, un espa?ol que trabaja para Sabre-Security.com coment¨®: "El hecho, recalcado por ellos, de que indexan sem¨¢nticamente, incorporando significado dentro de sus ¨ªndices me parece lo m¨¢s revolucionario de su forma de atacar el problema de la b¨²suqeda del lenguaje natural".
Powerset apuesta por una comunidad abierta de desarrolladores: 10.000 ya participan en ella, seg¨²n Steve Newcomb, el n¨²mero dos. Present¨® el proyecto como una mezcla de Digg, Facebook y las aplicaciones de Google, y dice apostar por una idea de la competencia que integra la sabidur¨ªa de la muchedumbre en su ambicioso objetivo que no es nada menos que "sustituir el coraz¨®n de los motores de b¨²squeda". No es el ¨²nico.
Empresa basada en Nueva York, pero financiada con capital exterior, Hakia.com trabaja tambi¨¦n el concepto de "b¨²squeda sem¨¢ntica", explica su fundador. Sabe que hoy por hoy resulta muy dif¨ªcil ganar a Google, pero afirma que Hakia es mejor para responder a las preguntas m¨¢s complicadas, o menos comunes: las que figuran en la larga cola de las b¨²squedas, para las cuales Google no sirve de mucho.
"Sin que sea necesario recurrir a las estad¨ªsticas, las b¨²squedas en la larga cola pueden ser analizadas por algoritmos sem¨¢nticos y dar instant¨¢neamente resultados que contienen el contexto pertinente", afirma Riza Berkan, fundador de Hakia. A diferencia de Powerset, Hakia ya est¨¢ funcionando.
Es muy temprano para saber si Hakia o Powerset (tambi¨¦n habr¨ªa que integrar Snap.com y ChaCha.com en este grupo de start-ups ambiciosas), pueden ganar a Google. Resulta muy sorprendente, sin embargo, ver que pueden dar resultados a veces comparables, a veces mejores, cuando a¨²n est¨¢n en fase de pruebas.
Peter Novik, director de investigaci¨®n para Google declar¨® hace algunos meses: "El enfoque estad¨ªstico es m¨¢s econ¨®mico, m¨¢s r¨¢pido, m¨¢s robusto, m¨¢s f¨¢cil de internacionalizar y m¨¢s eficicaz". Y con eso, Google es de uso sencillo. En junio Marisa Mayer, vicepresidenta de Google, desvel¨® algunas pistas que sigue la compa?¨ªa.
Destaca la traducci¨®n autom¨¢tica de una pregunta y de las respuestas. Por ejemplo, un egipcio en busca de un restaurante en Nueva York ganar¨ªa si su pregunta, hecha en ¨¢rabe, fuese autom¨¢ticamente traducida al ingl¨¦s para traer las respuestas de los sitios en ingl¨¦s, que, a su vez, ser¨ªan autom¨¢ticamente traducidas al ¨¢rabe.
M¨¢s sencillo y potencialmente muy ¨²til es el nuevo sistema de b¨²squeda por voz 1-800-GOOG-411. En fase de prueba permite buscar informaci¨®n sobre comercios locales. Su mejor¨ªa debe permitir una generalizaci¨®n de la b¨²squeda vocal y, seg¨²n Mayer, abre la puerta a la b¨²squeda de v¨ªdeos con la indexaci¨®n de di¨¢logos.
Tu suscripci¨®n se est¨¢ usando en otro dispositivo
?Quieres a?adir otro usuario a tu suscripci¨®n?
Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.
FlechaTu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.
En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.