Las m¨¢quinas tambi¨¦n aprenden euskera, catal¨¢n, gallego...
Los gobiernos vasco y navarro y la Oficina P¨²blica de la Lengua Vasca de Iparralde lanzan la plataforma Gaitu para crear una base de datos con voces y acentos diferentes
Wikipedia recoge en este momento 422.167 art¨ªculos escritos o traducidos al euskera. Esta lengua se sit¨²a entre las cuarenta m¨¢s utilizadas en esta enciclopedia colaborativa, llegando incluso a superar en n¨²mero de entradas a idiomas como el finland¨¦s o el noruego, apunta Jabi Arakama (Puente la Reina, 1981), director de Euskarabidea-Instituto Navarro del Euskera. Un hito, dado que el n¨²mero de vascoparlantes apenas supera el mill¨®n de personas. Ahora, se han planteado un nuevo reto: ense?ar a la Inteligencia Artificial a hablar en euskera. Para ello, los gobiernos vasco y navarro y la Oficina P¨²blica de la Lengua Vasca de Iparralde (pa¨ªs vasco franc¨¦s) han lanzado la plataforma Gaitu, que quiere crear una base de datos p¨²blica y gratuita con las voces y acentos de la ciudadan¨ªa para que las empresas, entidades y particulares puedan hacer uso de ella. Se enmarca en una iniciativa m¨¢s amplia, Common Voice, que ha creado a nivel internacional un banco p¨²blico de voces en m¨¢s de un centenar de lenguas.
Estas tres administraciones ¨Cunidas a trav¨¦s del convenio de colaboraci¨®n Hiruko Ituna- apenas llevan unas semanas difundiendo esta herramienta, pero cuentan ya con m¨¢s de 200 horas de grabaciones. Los voluntarios leen en voz alta alguna de las 100.000 frases disponibles y las registran en el programa. Adem¨¢s, pueden validar las voces de otras personas. Es decir, comprueban que los audios son correctos y se corresponden con las frases proporcionadas por la aplicaci¨®n. No se busca que las grabaciones sean perfectas, sino que se comprendan. ¡°Cualquier frase pronunciada de una manera entendible es susceptible de darse como v¨¢lida porque es lo que una m¨¢quina tiene que llegar a entender¡±. De cada tres horas grabadas, dos est¨¢n ya validadas, explica Arakama. Son datos muy buenos que se deben, entre otras cosas, a que el euskera tiene detr¨¢s una comunidad ling¨¹¨ªstica muy activa y, sobre todo, muy joven. El idioma ¡°se est¨¢ recuperando a trav¨¦s de la juventud¡±, asegura. En Euskadi, por ejemplo, la gran mayor¨ªa de j¨®venes menores de 25 a?os habla euskera. En Navarra, uno de cada cuatro personas entiende algo de euskera o lo habla bien y la mayor¨ªa de ellos son j¨®venes. Hay diferencias entre las comarcas: en la zona vasc¨®fona, se calcula que ocho de cada 10 j¨®venes lo habla, mientras que en la mixta y la no vasc¨®fona esa cifra se reduce much¨ªsimo.
La juventud de la comunidad ling¨¹¨ªstica euskaldun est¨¢ impulsando precisamente la adaptaci¨®n de las nuevas tecnolog¨ªas a esta lengua. ¡°Los datos son muy buenos en cuanto al uso del euskera en redes sociales. Eso es una buena noticia porque un gobierno puede querer dinamizar una lengua en cualquier ¨¢mbito, pero si no tienes una comunidad ling¨¹¨ªstica detr¨¢s a la que le interese, pues no haces nada. Tenemos una comunidad muy, muy activa en las nuevas tecnolog¨ªas, lo que demuestra que quiere el desarrollo integral de su lengua, que est¨¢ apostando por vivir en euskera¡±, se?ala Miren Dobaran, viceconsejera de Pol¨ªtica Ling¨¹¨ªstica del Gobierno vasco. En esta l¨ªnea, Dobaran explica que, en euskera, Gaitu significa ¡°capacitar¡±, capacitar a las m¨¢quinas, aunque tiene tambi¨¦n un ¡°sentido simb¨®lico de empoderamiento, de empoderarnos como hablantes, como comunidad ling¨¹¨ªstica, como part¨ªcipes de esa capacitaci¨®n¡±. No solo se refiere a quienes residen en Euskadi, Navarra o Iparralde, tambi¨¦n a la di¨¢spora. ¡°Es importante que todos los dialectos tengan su espacio¡±, subraya Arakama. En euskera, esos dialectos son conocidos como euskalkis y tienen diferencias fon¨¦ticas o gramaticales. Hay, de hecho, un euskera ¡°com¨²n¡±, el batua. El objetivo es entrenar a las m¨¢quinas para que todos ellos queden representados, para que sea la m¨¢quina la que se adapte al habla natural de la persona y no al rev¨¦s. ¡°Cuantas m¨¢s horas de grabaci¨®n tengamos mejor porque se ir¨¢ perfeccionando cada vez m¨¢s la inteligencia artificial. Se estima que a partir de unas 1.000 horas se pueden tener unos niveles dignos¡±, a?ade Arakama.
Las comunidades ling¨¹¨ªsticas peque?as son las que m¨¢s impulso est¨¢n dando a sus respectivos idiomas. Por ejemplo: el catal¨¢n supera ya en n¨²mero de horas grabadas y validadas al ingl¨¦s, al castellano o al chino. Esto puede deberse, considera Arakama, a la fortaleza de lo que en euskera se denomina auzolan, ¡°trabajo en com¨²n¡±. No hay ninguna instituci¨®n que pueda encargarse de contratar a un n¨²mero suficiente de personas para dedicarse a grabar y validar miles de horas, as¨ª que se ha solicitado a la ciudadan¨ªa ¡°que sea ella quien se grabe otras voces¡±. Dado que cada vez se utiliza m¨¢s la voz para las nuevas tecnolog¨ªas, apunta Dobaran, ¡°quienes queremos vivir en euskera o en lenguas minoritarias, sabemos que tenemos que hacer el esfuerzo de ense?ar a esas m¨¢quinas¡±. ¡°Creo que lo que ha animado a la gente es ese ¡®vamos a ense?ar a las m¨¢quinas a hablar en euskera y en el d¨ªa de ma?ana, los call centers nos podr¨¢n entender, nuestro coche, nuestros GPS¡±.
Ese es el objetivo: ofrecer los datos del banco de voces a las empresas tecnol¨®gicas grandes para que accedan a ¨¦l de forma gratuita. Tanto empresas como particulares o administraciones p¨²blicas. Cualquiera puede acceder al banco. Eso s¨ª, matiza Arakama, con garant¨ªas legales y de destino final de las voces. M¨¢s que las empresas, consideran que quien se va a beneficiar del proyecto es la ciudadan¨ªa vascoparlante. ¡°Muy pocas empresas por su cuenta van a ponerse a desarrollar esta base de datos para una comunidad ling¨¹¨ªstica de un mill¨®n de personas. Necesitan cierta masa cr¨ªtica¡±, concluye.
Gaitu.eus es una de las iniciativas lanzadas para fomentar el uso del euskera, pero hay m¨¢s que est¨¢n dando buenos resultados, como Euskaraldia. Un ejercicio social masivo que pretende cambiar los h¨¢bitos ling¨¹¨ªsticos de la ciudadan¨ªa y fomentar las oportunidades de hablar en euskera. Hay quienes, por verg¨¹enza o por no saber si su interlocutor les entiende, inician las conversaciones directamente en castellano, explica Arakama. Con esta iniciativa, que se realiza desde hace unos a?os, coincidiendo con el d¨ªa del euskera ¨C3 de diciembre-, se anima a quienes lo deseen a portar una chapa sobre la ropa: belarriprest (entiendo euskera, lo hable o no, as¨ª que h¨¢blame en euskera, aunque sea una conversaci¨®n biling¨¹e) o aho bizi (iniciar¨¦ la conversaci¨®n en euskera y la seguir¨¦ si me entienden). De este modo, se?alan desde Euskarabidea, se proporciona un elemento identificativo que favorece que el euskera tenga una mayor presencia en el espacio p¨²blico. De momento, aseguran, funciona. Dos de cada tres personas participantes en la ¨²ltima edici¨®n han declarado haber cambiado sus h¨¢bitos ling¨¹¨ªsticos a trav¨¦s de esta iniciativa.
Tu suscripci¨®n se est¨¢ usando en otro dispositivo
?Quieres a?adir otro usuario a tu suscripci¨®n?
Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.
FlechaTu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.
En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.