Cada vez oir¨¢s m¨¢s voces sint¨¦ticas. Y te parecer¨¢n humanas
La ¨²ltima revoluci¨®n tecnol¨®gica retoma la tradici¨®n oral. Con m¨²ltiples usos, la clonaci¨®n de voces puede catapultar las pujantes industrias de podcast y audiolibro
La pr¨®xima vez que veas una pel¨ªcula, escuches un podcast o un audiolibro, f¨ªjate bien en qui¨¦n te habla. Puede que sea un robot. De unos a?os a esta parte las m¨¢quinas han empezado a hablar y su parloteo es ya imparable. Comenzaron respondiendo a nuestras preguntas t¨ªmidamente. Alexa, Siri y un batall¨®n de asistentes virtuales cambiaron la forma que ten¨ªamos de comunicarnos con las m¨¢quinas, haci¨¦ndola m¨¢s natural y ...
La pr¨®xima vez que veas una pel¨ªcula, escuches un podcast o un audiolibro, f¨ªjate bien en qui¨¦n te habla. Puede que sea un robot. De unos a?os a esta parte las m¨¢quinas han empezado a hablar y su parloteo es ya imparable. Comenzaron respondiendo a nuestras preguntas t¨ªmidamente. Alexa, Siri y un batall¨®n de asistentes virtuales cambiaron la forma que ten¨ªamos de comunicarnos con las m¨¢quinas, haci¨¦ndola m¨¢s natural y fluida. Pero sus voces eran monocordes y ¨¢tonas, era dif¨ªcil mantener la atenci¨®n del oyente en un discurso largo. Desde entonces, las voces sint¨¦ticas se han perfeccionado hasta llegar al punto en que hoy es posible clonar la voz de cualquier humano de forma que sea indistinguible del original.
Sucedi¨® hace un par de a?os con la serie The Mandalorian. Cuando apareci¨® Luke Skywalker en pantalla, muchos se dieron cuenta de que el actor Mark Hamill hab¨ªa sido rejuvenecido por ordenador. Pero pocos notaron que su voz tambi¨¦n era sint¨¦tica. La empresa ucrania Respeecher se hab¨ªa encargado de hacerlo usando viejas grabaciones. Una persona ley¨® las frases del guion y el algoritmo cambi¨® su entonaci¨®n para que la voz sonara como la de un joven Hamill. Para Respeecher aquello fue un hito, pero no se durmieron en los laureles y siguieron perfeccionando su software. Ahora es capaz de usar la voz de un actor para que entone un discurso en otro idioma. La idea era demostrarlo en alguna pel¨ªcula que fuera doblada de forma autom¨¢tica, usando la voz original de los propios actores. Pero no fue posible. Las bombas empezaron a caer.
Las calles de Kiev, sede de Respeecher, se llenaron de tanques y barricadas y los planes se truncaron. Ellos decidieron quedarse en Ucrania y seguir trabajando. Y demostraron el potencial de su tecnolog¨ªa traduciendo al ucranio los mensajes de apoyo que les mandan famosos internacionales. ¡°Si le hablas a un hombre en un idioma que entiende, el mensaje le llega a la cabeza. Si le hablas en su propio idioma, le llega al coraz¨®n¡±. La frase es de Mandela, pero la repite Alex Serdiuk, director de Respeecher, en su apartamento de Kiev, que luce ordenado, ordinario y orgulloso en videollamada. Y parece cobrar un nuevo sentido. ¡°Rusia quiere destruir nuestro idioma por ser parte de nuestra historia¡±, dice Serdiuk con aplomo quebradizo. ¡°Por eso estos mensajes han tenido especial eco en la sociedad¡±.
Es un ejemplo del potencial de esta tecnolog¨ªa, pero quiz¨¢ no el m¨¢s habitual. Tambi¨¦n sirve para traer a la vida las voces de quienes ya no est¨¢n, como sucedi¨® en el concierto tributo al DJ Avicii. Para doblar pel¨ªcu?las con las voces de los actores originales. Para rejuvenecer o envejecer una voz o incluso para cambiarla de g¨¦nero. Esto tiene aplicaciones en el mundo del ocio, los servicios o incluso en la sanidad. ¡°Acabamos de crear un departamento de salud que trabaja para que personas que han perdido el habla puedan expresarse con su antigua voz gracias a la clonaci¨®n¡±, se?ala Serdiuk.
Mireia Farr¨²s Cabeceran, profesora de Ling¨¹¨ªstica Computacional en la Universidad de Barcelona, explica que el salto cualitativo en esta tecnolog¨ªa se debe a c¨®mo ha cambiado la forma de producir las voces. ¡°Uno de los m¨¦todos m¨¢s utilizados hasta ahora era la concatenaci¨®n: se juntaban segmentos de voces pregrabadas y se un¨ªan para lograr el mensaje que interesara¡±, explica. Era como un puzle de sonidos. Pero en los ¨²ltimos a?os el m¨¦todo ha cambiado. ¡°Ahora se basa en el uso de redes neuronales, algoritmos matem¨¢ticos que tratan de imitar c¨®mo se conectan las neuronas en nuestro cerebro¡±. Con este m¨¦todo, mucho m¨¢s sofisticado y complejo, las voces pueden imitar las inflexiones, tonos y sentimientos de una persona real. Y esto abre un nuevo abanico de posibilidades.
Imagina que tu jefe, en lugar de enviarte informes, memorandos y balances, te pasara un audio. Que pudieras ponerte al d¨ªa mientras das un paseo, haces deporte o limpias tu casa. No es ciencia ficci¨®n, es lo que hacen muchas empresas que acuden a Voikers. Esta compa?¨ªa crea podcasts, audiolibros y otros contenidos de audio para marcas, sirvi¨¦ndose de voces reales y sint¨¦ticas. ¡°Estas ¨²ltimas han avanzado much¨ªsimo¡±, se?ala su director, Roberto Carreras. ¡°En ingl¨¦s es pr¨¢cticamente imposible distinguir una voz sint¨¦tica de una original. En espa?ol a¨²n no, pero llegaremos, porque la cosa est¨¢ avanzando a un ritmo exponencial¡±, afirma. Ayudar¨¢, y mucho, el Proyecto Estrat¨¦gico para la Recuperaci¨®n y Transformaci¨®n Econ¨®mica de 1.100 millones aprobado por el Gobierno esta semana. El dinero se destinar¨¢ a la nueva econom¨ªa de la lengua, para conseguir una Inteligencia Artificial que piense en espa?ol. Las m¨¢quinas est¨¢n aprendiendo idiomas, y es importante no quedarse atr¨¢s. ¡°Creo que dentro de cinco a?os, el audio estar¨¢ mucho m¨¢s presente en toda nuestra vida¡±, sentencia Carreras.
No es el ¨²nico que lo ve as¨ª. Seg¨²n un an¨¢lisis de McKinsey & Company, una consultora de gesti¨®n, el mercado de las voces artificiales alcanzar¨¢ m¨¢s de 1.000 millones de d¨®lares en los pr¨®ximos cinco a?os. Los podcasts y los audiolibros son las industrias donde m¨¢s impactar¨¢ esta tecnolog¨ªa. Y no son dos mercados menores. Seg¨²n Statista, la audiencia global del podcast supera los 621 millones de oyentes al a?o. En 2021 movi¨® m¨¢s de 14.000 millones y se espera que para 2028 supere los 94.000 millones. Por su parte, el mercado editorial ha encontrado en el audio un empuje en sus balances. ¡°El audiolibro est¨¢ siendo la mayor revoluci¨®n desde la aparici¨®n del libro de bolsillo¡±, asegura Ra¨²l P¨¦rez, director del ?rea Editorial de Planeta. ¡°Lleva creciendo, de forma constante, desde hace cinco a?os¡±, reconoce. Y todos los indicadores sugieren que seguir¨¢ haci¨¦ndolo. Los ingresos totales de las editoriales de libros de EE UU disminuyeron ligeramente entre 2015 y 2020 y los de los libros electr¨®nicos se redujeron, pero los de los audiolibros aumentaron un 157%, seg¨²n datos de la Asociaci¨®n de Editores Estadounidenses. Estas cifras podr¨ªan dispararse cuando la tecnolog¨ªa permita convertir en audio cualquier libro, y no solo los grandes superventas. En la actualidad los suelen locutar actores y es un proceso largo y costoso, no todas las editoriales pueden permit¨ªrselo. Pero la mejora de las voces sint¨¦ticas podr¨ªa cambiar este panorama.
Solo llevamos unos a?os ense?ando a los ordenadores a hablar, pero estos han demostrado ser unos alumnos brillantes. Su perfeccionamiento ha permitido que nuestras palabras se despeguen de la pantalla y vuelen en forma de sonidos. Y que un nuevo coro de voces, reales y sint¨¦ticas, conquiste internet. Han podido ayudar la fibra ¨®ptica, el 5G o la inteligencia artificial. Pero al final esto no va tanto de tecnolog¨ªa como de comunicarnos. Y la voz, aunque sea sint¨¦tica, sigue siendo el canal m¨¢s antiguo y eficiente de contarnos historias.
Ap¨²ntate aqu¨ª a la newsletter semanal de Ideas.