El espa?ol y los buscadores
?En qu¨¦ se parece la receta del gazpacho al horario del Museo del Prado y a la vida de Cervantes? En que para conocerlos acudimos a Internet, a trav¨¦s de un buscador. El procedimiento funciona tan razonablemente bien que cuesta imaginar la ¨¦poca en que no exist¨ªa. Los buscadores son la v¨ªa privilegiada de acceso a las webs, hasta el extremo de que para muchos han suplantado a los sitios: si preguntamos a un estudiante la procedencia de un dato, probablemente responda: "?De Google!".
Los buscadores segmentan las consultas por lenguas y secundariamente por pa¨ªses. Los espa?oles son usuarios mayoritariamente de Google.es, y los franceses de Google.fr. Igual que su lengua, uno lleva consigo su buscador, y los alumnos del Liceo Franc¨¦s de Madrid usan tambi¨¦n Google.fr. En el mundo hay unas 5.000 lenguas, pero no todas se escriben, y de las que se escriben no todas tienen presencia en Internet, donde hay unas 600 lenguas. Por ejemplo, la enciclopedia colaborativa Wikipedia est¨¢ disponible en 230. Los buscadores han comenzado por las lenguas con m¨¢s navegantes: Google detecta 35 idiomas (aunque permite acceder a p¨¢ginas escritas en otros). De las lenguas con alfabeto latino, el ingl¨¦s es la m¨¢s presente en la Red (casi con la mitad de p¨¢ginas); en orden decreciente le siguen el alem¨¢n, el franc¨¦s y el espa?ol.
Nuestra lengua abarca muchos pa¨ªses, pero en la web constituye un espacio ¨²nico accesible a los buscadores. Google, por ejemplo, no indiza todas las p¨¢ginas de la web en espa?ol, sino quiz¨¢ un 40% (no el 8% que hace poco declaraba el anterior ministro de Industria). Ning¨²n buscador recoge todas las p¨¢ginas en una lengua: indizan s¨®lo la parte m¨¢s importante de su web.
Pero el uso de los buscadores no es s¨®lo una cuesti¨®n tecnol¨®gica, sino tambi¨¦n cultural y pol¨ªtica. Hace a?o y medio Jean-N?el Jeanneney, director de la Biblioth¨¨que Nationale de France, publicaba un art¨ªculo en Le Monde se?alando el peligro que corr¨ªa la cultura europea accediendo a sus contenidos mayoritariamente a trav¨¦s de Google, ?una empresa americana, y con fines de lucro! Tambi¨¦n clamaba contra el plan de digitalizaci¨®n masiva de libros que planea el buscador. La respuesta de la Uni¨®n Europea ha sido la futura Biblioteca Digital Europea, que estar¨¢ organizada, seg¨²n Jeanneney, "contra la tentaci¨®n del desbarajuste, seg¨²n los principios de la raz¨®n", y paralelamente se prepara un buscador franco-alem¨¢n, de nombre latino: Quaero, "busco". Presuntamente va a arreglar el tambi¨¦n presunto sesgo norteamericano de la cultura europea en los buscadores, aunque no sabemos c¨®mo.
?Es ¨¦sta la mejor soluci¨®n? Por ejemplo: ?ser¨ªa bueno un nuevo buscador de Internet para el espa?ol? Depende: la tecnolog¨ªa de b¨²squeda lleva a?os de desarrollo y no parece f¨¢cil emularla. Indizar mayor porcentaje de la Red en espa?ol puede tener unos costes exorbitantes... para rendir un servicio muy poco mejor. Primar resultados espa?oles o hispanoamericanos frente a los de otros or¨ªgenes (para as¨ª defender una identidad cultural) es absurdo, si lo que se quiere es dar un buen servicio. Incluir bases de datos ahora opacas a los buscadores puede ser ¨²til, aunque sus instituciones responsables tambi¨¦n pueden hacer acuerdos para integrarlas en los buscadores actuales.
Aunque caben mejoras locales. Una empresa de Telef¨®nica ha lanzado el buscador Noxtrum (como se ve, el lat¨ªn est¨¢ de moda), que usa las bases de datos comerciales de las P¨¢ginas Amarillas, mientras que el Instituto Cervantes anuncia un Buscador Panhisp¨¢nico (que ojal¨¢ cambie un nombre de resonancias tan imperialistas), con catalogaci¨®n de contenidos y una selecci¨®n de sitios hecha por expertos.
Es dudoso que un nuevo buscador compense el esfuerzo que costar¨ªa, pero hay cosas que se pueden hacer a favor de la web en espa?ol. La primera: crear m¨¢s y mejores p¨¢ginas en nuestra lengua. ?sta es una tarea para instituciones como bibliotecas (que ya est¨¢n incorporando a la Red nuestro patrimonio cultural) o universidades (que comienzan a publicar digitalmente su producci¨®n), pero tambi¨¦n para las empresas y los ciudadanos. Por ejemplo: un estudio reciente demuestra que las editoriales hacen escaso uso de la web para promocionar sus libros; los blogs profesionales o la Wikipedia espa?ola podr¨ªan crecer y mejorar.
El segundo requisito es que las p¨¢ginas faciliten el trabajo de los motores de b¨²squeda, haciendo que sus contenidos sean accesibles sin barreras para cualquier buscador (en vez de ahogar sus datos en animaciones). As¨ª, hoy podr¨¢ indizarlas Yahoo o Google, y ma?ana, ?qui¨¦n sabe? En b¨²squeda estamos ante un oligopolio de facto, pero la mejor manera de evitarlo es permitir que puedan competir otros agentes.
Pero hay un flanco en el que podr¨ªamos intervenir: las tecnolog¨ªas ling¨¹¨ªsticas. Cuando lleguen los buscadores "sem¨¢nticos", ser¨¢ imprescindible que haya sistemas autom¨¢ticos para la lengua espa?ola. Un ejemplo simple: ante la demanda de un "pintor en C¨®rdoba" el buscador podr¨ªa preguntar "?de paredes o de cuadros?", y al analizar las p¨¢ginas el sistema deber¨ªa deducir que el pintor de un documento que habla de brochas y rodillos es del primer tipo, y el que est¨¢ con ¨®leo o retrato del segundo. Crear programas que "entiendan" el espa?ol es un objetivo que deber¨ªan emprender los investigadores y las empresas del mundo hispanohablante... o nos vendr¨¢n de fuera.
El simple ejercicio de pensar qu¨¦ tipo de buscador necesita el espa?ol pone en cuesti¨®n nuestro modelo de desarrollo tecnol¨®gico y de pol¨ªtica ling¨¹¨ªstica. Las empresas que dominan Internet nacieron en garajes o universidades americanas, consiguieron capital riesgo y dominaron el mercado. Hagamos que avance la investigaci¨®n en nuestras universidades (que generan poqu¨ªsimas patentes), que florezcan peque?as empresas (ahora envueltas en trabas burocr¨¢ticas) y que puedan captar capitales, o no podremos quejarnos cuando otros hagan lo que nosotros no hicimos. Lo que necesita Europa no es repetir lo que ya existe (so pretexto de que no refleja nuestra cultura), sino vivir el esp¨ªritu de innovaci¨®n de donde sale lo que existir¨¢ ma?ana.
Jos¨¦ Antonio Mill¨¢n es autor de Internet y el espa?ol.
Tu suscripci¨®n se est¨¢ usando en otro dispositivo
?Quieres a?adir otro usuario a tu suscripci¨®n?
Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.
FlechaTu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.
En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.