El creador de diez millones de art¨ªculos en Wikipedia: ¡®¡®Mi bot ha contribuido a contrarrestar los sesgos¡¯¡¯
El sueco Sverker Johansson ha convertido al cebuano en la segunda lengua con m¨¢s art¨ªculos en la enciclopedia virtual gracias a un programa autom¨¢tico
Sverker Johansson (Lund, Suecia, 1961) ha creado m¨¢s art¨ªculos que nadie en Wikipedia: 10 millones de los 55 que existen entre todas las lenguas. Hace casi 10 a?os dise?¨® el Lsjbot, un programa que efect¨²a tareas autom¨¢ticas, como escribir este tipo de textos, que ha llevado al sueco y al cebuano (el idioma materno de su esposa, originaria de Filipinas, hablada por unos 20 millones de personas) a ser las segunda y tercera lenguas con m¨¢s art¨ªculos en la gran enciclopedia colaborativa. Se calcula que el 99% de los text...
Reg¨ªstrate gratis para seguir leyendo
Si tienes cuenta en EL PA?S, puedes utilizarla para identificarte
Sverker Johansson (Lund, Suecia, 1961) ha creado m¨¢s art¨ªculos que nadie en Wikipedia: 10 millones de los 55 que existen entre todas las lenguas. Hace casi 10 a?os dise?¨® el Lsjbot, un programa que efect¨²a tareas autom¨¢ticas, como escribir este tipo de textos, que ha llevado al sueco y al cebuano (el idioma materno de su esposa, originaria de Filipinas, hablada por unos 20 millones de personas) a ser las segunda y tercera lenguas con m¨¢s art¨ªculos en la gran enciclopedia colaborativa. Se calcula que el 99% de los textos en cebuano los ha creado su bot.
Aun as¨ª, Sverker no se ha librado de la controversia: en 2020 la comunidad de Wikipedia en Suecia opt¨® por prescindir de su programa inform¨¢tico (software) y que, de ah¨ª en adelante, no creara m¨¢s textos en sueco. Hasta entonces, los contenidos elaborados por su bot constitu¨ªan el 80% de los que ten¨ªa la enciclopedia coral en ese idioma. Aunque cuenta con 45 a?os de experiencia como programador, Sverker se doctor¨® en f¨ªsica de part¨ªculas hace tres d¨¦cadas y desde esa ¨¦poca tambi¨¦n estudia los or¨ªgenes del lenguaje. Este mismo a?o ha publicado En busca del origen del lenguaje, donde indaga c¨®mo adquiri¨® esa capacidad el ser humano.
Pregunta: Es f¨ªsico y estudia los or¨ªgenes del lenguaje, ?c¨®mo acab¨® programando un bot?
Respuesta: Me doctor¨¦ en f¨ªsica de part¨ªculas hace 30 a?os, pero me cans¨¦ de las grandes investigaciones industrializadas en las que cada individuo es solo una peque?a parte del engranaje. En esa ¨¦poca empezaron a fascinarme las lenguas, me di cuenta de que no se sab¨ªa nada de los or¨ªgenes del lenguaje y quise hacer algo al respecto. A programar empec¨¦ antes, por diversi¨®n, en el instituto. Disfrutaba de todo lo que se pod¨ªa hacer con un ordenador, aunque no hubiera internet todav¨ªa.
P: ?C¨®mo se le ocurri¨® crear el Lsjbot? ?Escrib¨ªa art¨ªculos en Wikipedia antes de eso?
R: S¨ª, empec¨¦ a escribir en 2007. Elabor¨¦ art¨ªculos durante cinco a?os hasta que descubr¨ª que, en los Pa¨ªses Bajos, alguien utilizaba un bot para escribir textos sencillos que conten¨ªan una sola oraci¨®n, como: ¡®¡¯Esta especie es un tipo de insecto¡¯¡¯, sin m¨¢s. Pens¨¦ que pod¨ªa hacerlo mejor y lo tom¨¦ como un desaf¨ªo. Para los art¨ªculos sobre geograf¨ªa, mi bot analiza el terreno colindante, la altitud, calcula si est¨¢ situado en las monta?as o en una llanura, encuentra la ciudad m¨¢s pr¨®xima¡
P: ?C¨®mo es capaz de realizar esa operaci¨®n 10.000 veces al d¨ªa?
R: El bot trabaja con bases de datos y con vocabulario. Contiene cientos de oraciones est¨¢ndar que utiliza para empezar un art¨ªculo: X es un tipo de Y que pertenece a la familia Z, y as¨ª. Despu¨¦s, toma la informaci¨®n de la base de datos y sit¨²a en la X el nombre del animal y en la Y el tipo de especie. A partir de ah¨ª construye el art¨ªculo. En ese sentido, es una programaci¨®n bastante sencilla; la complejidad reside en indagar a trav¨¦s de toda la informaci¨®n y construir correctamente las estructuras.
P: ?C¨®mo decide qu¨¦ fuentes debe utilizar el programa para elaborar los textos?
R: Me encargo de buscar manualmente las bases de datos para asegurarme de que son de calidad, que tienen buena reputaci¨®n y que son fiables.
P: ?Hay alguna forma de programar el bot para que aquello que escribe parezca m¨¢s humano?
R: S¨ª que las hay. Podr¨ªan introducirse variaciones en las frases y cambiar el orden o la elecci¨®n de las palabras, pero no quiero aparentar nada. El contenido que crea el bot debe parecer creado por un bot.
P: ?Por qu¨¦ cree que Wikipedia en Suecia no quiso que su bot siguiera en marcha?
R: Es una larga historia llena de discrepancias: ?Deber¨ªamos tener textos sobre todas las colinas de todos los pa¨ªses o no? ?Y sobre todos los pueblos? Tambi¨¦n preocupaba la calidad de los textos y los errores. Adem¨¢s, a algunos no les gustan los art¨ªculos escritos por bots. Uno de los creadores de Wikipedia en sueco ten¨ªa como pasatiempos escribir art¨ªculos sobre Albania y se puso furioso cuando mi bot se encarg¨® de toda su geograf¨ªa en un solo d¨ªa. Desde mi punto de vista, Wikipedia es para los lectores y su prop¨®sito es aportar la informaci¨®n que la gente busca, no servir de afici¨®n a aquellos que la escriben.
P: ?Planea incluir m¨¢s ¨¢reas del conocimiento en los art¨ªculos?
R: Lo tengo en mente, pero no pretendo imponerlos en ning¨²n pa¨ªs. Me gustar¨ªa crear art¨ªculos sobre todas las lenguas del mundo y, de hecho, dispongo del software necesario para ello. Tambi¨¦n sobre literatura y autores, porque Wikipedia est¨¢ muy sesgada: hay muchos m¨¢s art¨ªculos sobre escritores varones que sobre escritoras y, en el ¨¢rea de la geograf¨ªa, muchos m¨¢s textos sobre pueblos y ciudades de Espa?a, por ejemplo, que de ?frica.
P: ?Y su bot puede solucionar eso?
R: S¨ª, porque el bot toma todos los lugares. Si escribiera art¨ªculos sobre autores, b¨¢sicamente descargar¨ªa el cat¨¢logo completo de la Biblioteca Nacional de Espa?a, lo analizar¨ªa y crear¨ªa textos sobre todos ellos, tanto de hombres como de mujeres. Wikipedia est¨¢ en gran parte escrita por varones j¨®venes y los art¨ªculos que elaboran son sobre aquello que les interesa a ellos. Wikipedia est¨¢ haciendo un esfuerzo para contrarrestarlo y creo que mi bot ha contribuido a ello. Los bots no est¨¢n sesgados.
P: Desde que cre¨® este sistema autom¨¢tico en 2012, ?ha escrito usted alg¨²n art¨ªculo?
R: Solo unos cuantos.
P: ?El suyo?
R: No. Evit¨¦ encargarme del que habla sobre m¨ª, aunque, para que fuera preciso, aport¨¦ algunas fuentes y habl¨¦ en el foro que hay tras la p¨¢gina. Los art¨ªculos que suelo escribir est¨¢n relacionados con el trabajo del propio bot: en una ocasi¨®n, escribi¨® sobre una monta?a y la palabra ¡®¡¯monta?a¡¯¡¯ se enlazaba con un art¨ªculo de monta?as en general, pero descubr¨ª que ese art¨ªculo no exist¨ªa en cebuano, as¨ª que lo escrib¨ª yo mismo.
P: ?Le resulta m¨¢s complicado programar el bot para que emplee el cebuano o el idioma no es relevante en la configuraci¨®n?
R: Puedes crear contenido en cualquier lengua siempre y cuando un hablante nativo ayude con el vocabulario y las oraciones. El bot necesita unas 1.000 palabras y alguien debe prove¨¦rselas.
P: El Lsjbot ha elaborado aproximadamente el 99% de los art¨ªculos de Wikipedia en cebuano. ?Qu¨¦ ocurrir¨ªa si dejara de crear contenido en esa lengua?
R: Seguir¨ªa estando ese 1% y seguir¨ªa habiendo personas que escribieran en cebuano. Por supuesto, sin mi bot, Wikipedia en cebuano no ser¨ªa la segunda de mayor tama?o en todo el mundo.
P: ?Le gustar¨ªa crear contenido en otros idiomas?
R: S¨ª, siempre que la comunidad de Wikipedia en otros pa¨ªses me invite. Necesitar¨ªa su cooperaci¨®n, la ayuda de los hablantes nativos para poder crear las frases y palabras necesarias. Tambi¨¦n necesitar¨ªa apoyo, tendr¨ªa que estar seguro de que est¨¢n a favor del trabajo del bot.
Puedes seguir a EL PA?S TECNOLOG?A en Facebook y Twitter o apuntarte aqu¨ª para recibir nuestra newsletter semanal.