La herramienta de IA de Google para ayudar a salvar las dificultades del habla
Google ha presentado su proyecto Parrotron, una aplicaci¨®n de inteligencia artificial que estudia los patrones de habla de cada persona para convertirlos en un lenguaje sintetizado y fluido.
Google ha presentado su proyecto Parrotron, una red neuronal de extremo a extremo que transforma patrones de habla at¨ªpicos en un lenguaje sintetizado y fluido, y que esta dirigido a personas con discapacidades del habla, seg¨²n informa la compa?¨ªa en su blog corporativo.
El proyecto Parrotron est¨¢ centrado en el habla, y logra este proceso sin la necesidad de producir texto y omitiendo el paso de reconocimiento de se?ales del lenguaje (como el movimiento de los labios). El objetivo es que esta tecnolog¨ªa se pueda emplear entre humanos y con motores de reconocimiento de lenguaje autom¨¢tico (ASR, por sus siglas en ingl¨¦s).
Esta herramienta es parte del proyecto Euphonia, que, seg¨²n Google, ha demostrado "que los modelos de reconocimiento de voz pueden mejorarse significativamente para transcribir mejor una variedad de habla at¨ªpica y dis¨¢rtrica". Google, as¨ª, ha partido de los asistentes virtuales y servicios de reconocimiento de voz, herramientas que estas personas no puden usar debido a sus dificultades.
Como explica Google en un comunicado publicado en su blog de Inteligencia Artificial, Parrotron ha sido entrenado en dos fases utilizando dos recopilaciones paralelas de pares de voz de entrada/salida.
Para ello, los investigadores construyeron un modelo de conversi¨®n de voz a voz para el habla fluida est¨¢ndar. Posteriormente personalizaron el modelo, adapt¨¢ndolo a los patrones de voz at¨ªpicos de la persona con dificultades. Recurrieron a datos paralelos derivados autom¨¢ticamente con un sistema de s¨ªntesis de voz a texto (TTS). Un sistema text-to-speech (TTS) convierte el lenguaje de texto normal en habla; otros sistemas recrean la representaci¨®n simb¨®lica ling¨¹¨ªstica como transcripciones fon¨¦ticas en habla. Una de las personas m¨¢s famosas que han usado estos sistemas ha sido el cient¨ªfico Stephen Hawking.
Google desarroll¨® varias pruebas del sistema Parrotron, entre ellas, una con un investigador y matem¨¢tico de Google, Dimitri Kanevsky, de origen ruso y profundamente sordo, de padres con audici¨®n normal, y con Aubrie Lee, una defensora de la inclusi¨®n de discapacitados que tiene una distrofia muscular.
En el caso de Dimitri, se grabaron 15 horas de discurso, que se utilizaron para adaptar el modelo base a los matices espec¨ªficos de su discurso. El sistema Parrotron le ayud¨® a ser comprendido tanto por los investigadores como por el sistema ASR de Google por igual. El funcionamiento del motor ASR de Google en la salida de Parrotron redujo significativamente la tasa de error de palabra del 89% al 32%.
Aubrie, por su parte, aport¨® 1,5 horas de grabaciones de voz que han sido claves para ejemplificar el exito esta tecnolog¨ªa de voz.
Tu suscripci¨®n se est¨¢ usando en otro dispositivo
?Quieres a?adir otro usuario a tu suscripci¨®n?
Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.
FlechaTu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.
En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.