La inteligencia artificial llega al ¡®podcast¡¯
La reconstrucci¨®n de voces del pasado y las voces algor¨ªtimicas son dos de las herramientas m¨¢s empleadas en el 'podcasting'
No son pocas las series televisivas que, en los ¨²ltimos tiempos, tienen a grandes empresas tecnol¨®gicas como centros narrativos de sus tramas. Si en Devs (la serie de HBO) era Amaya, una compa?¨ªa que cuenta con un departamento privado de innovaci¨®n llamado Devs y en cuyo interior trabaja gente desarrollando un algoritmo cu¨¢ntico, en Homecoming ¨Cla serie de Amazon basada en el podcast de Gimlet Media de la que ya hablamos en este blog¨C, la trama se despliega en Geist Group, una gran corporaci¨®n que ayuda a los soldados estadounidenses a hacer la transici¨®n a la vida como civiles. La ¨²ltima en sumarse a la n¨®mina de compa?¨ªas tecnol¨®gicas demiurgas es Horizen Lakeview, la empresa ficticia de la serie Upload que en el a?o 2033 puede lograr que los humanos suban a un ¡°cielo digital¡±, carg¨¢ndose una vida futura virtual a su elecci¨®n. Todas estas series tienen en com¨²n el empleo del futuro como excusa narrativa, pero como sucede m¨¢s veces de las que creemos, el formato podcast ensay¨® con antelaci¨®n estas historias que encuentran su mayor simbolismo en una de las tendencias m¨¢s relevantes del futuro: la voz.
Asistentes de voz como protagonistas
La ingeniosa premisa del podcast de ficci¨®n Sandra (tambi¨¦n en Gimlet) tiene a un asistente virtual como protagonista. A trav¨¦s de siete episodios, seguimos las andanzas de Helen en Orbital Teledynamics, un gigante corporativo tecnol¨®gico que fabrica el asistente virtual favorito del pa¨ªs: Sandra, una suerte de Alexa, Aura o Siri ficticia. Sin desvelar nada sustancial podemos decir que Sandra no es un robot al servicio de la humanidad, sino una horda de personas reales que se hacen pasar por una entidad virtual omnisciente. Orbital tiene un edificio completo de trabajadores, asignados a diferentes especialidades para responder a los usuarios de Sandra. La voz de la asistente virtual pertenece a Kristen Wiig, a la que adornan con un ligero tono maquinal.
El argumento de un humano enamor¨¢ndose de una voz lo instaur¨® con especial acierto en el cine Spike Jonze con su film Her, en el que la sensual, divertida y compasiva voz de Scarlett Johansson interpretaba a un sistema operativo con un avanzado modelo de inteligencia artificial llamado Samantha. En el libro Lo imprevisible (Planeta), Marta Garc¨ªa Aller cuenta que el ingeniero jefe de Apple le confes¨® que cada vez hab¨ªa m¨¢s gente que se enamoraba de Siri. En Apple, por tanto, ya hay un equipo trabajando en desarrollar nuevas capacidades para Siri, de manera que se transformar¨¢ de una asistente a una compa?era emocional.
Tal vez inspirado por todas estas historias, el escritor Manuel Bartual acaba de lanzar Biotop¨ªa, una ficci¨®n sonora con apariencia de bolet¨ªn informativo en la que comenz¨® a trabajar durante el confinamiento: ¡°Biotop¨ªa es un centro de investigaci¨®n y desarrollo tecnol¨®gico avanzado en el que la materia, el tiempo y el espacio se comportan de un modo extra?o. En realidad es una ficci¨®n sonora. Hablando una noche con la actriz Nikki Garc¨ªa mientras cen¨¢bamos por Skype, se nos ocurri¨® que pod¨ªamos preparar un podcast para tener la cabeza ocupada con algo en aquellos d¨ªas, as¨ª que me puse a pensar en c¨®mo podr¨ªa ser ese podcast, aprovechando que ella ten¨ªa medios para grabarse desde casa y luego yo pod¨ªa editar todo desde la m¨ªa¡±. Biotop¨ªa es un proyecto que nace de ciertas limitaciones y hacen de ellas una virtud narrativa. Por ejemplo, para incorporar otras voces a Biotop¨ªa, Bartual fue utilizando el recurso de las llamadas telef¨®nicas, lo que ha permitido que el resto de actores y actrices que han participado se graben tambi¨¦n desde sus casas, utilizando la mayor¨ªa sus tel¨¦fonos m¨®viles. En el primer cap¨ªtulo, adem¨¢s de Nikki Garc¨ªa ejerciendo de presentadora del bolet¨ªn informativo, est¨¢n tambi¨¦n Ingrid Garc¨ªa-Jonsson, Olga Aguirre, Juli¨¢n G¨¦nisson, Javi Rojo y Claudio Serrano.
Una de las peculiaridades de Biotop¨ªa es la utilizaci¨®n de voces algor¨ªtmicas: ¡°Hemos utilizado una aplicaci¨®n de lectura de textos que te permite elegir entre diferentes voces. Uno de los personajes de Biotop¨ªa es AmaIA, una inteligencia artificial desarrollada por un equipo de ciencias del entretenimiento cuyo ¨²ltimo trabajo es Dentro de Biotop¨ªa, una serie sobre el origen de esta comunidad cient¨ªfica¡±.
En el a?o 2018, Google presentaba Google Duplex, una nueva tecnolog¨ªa que permit¨ªa al asistente virtual de Android realizar llamadas telef¨®nicas para hacer reservas y pedir citas. All¨ª mismo hicieron una demostraci¨®n: una conversaci¨®n real entre su inteligencia artificial y una peluquer¨ªa. La persona que respond¨ªa no se percat¨® en ning¨²n momento que su interlocutora no era humana. Un art¨ªculo de Axios pon¨ªa en duda que esas llamadas fueran reales. Por ejemplo, atendiendo al paisaje sonoro, en aquella llamada no hab¨ªa ning¨²n tipo de ruido ambiental. Ni secadores, ni conversaciones. Adem¨¢s, Axios llam¨® a m¨¢s de dos docenas de peluquer¨ªas y restaurantes, y todos dieron el nombre comercial inmediatamente al responder la llamada. ?Por qu¨¦ la peluquer¨ªa de la demostraci¨®n de Google no lo hizo? La respuesta no la sabemos pero, sin duda, aquel experimento hizo cuestionarse algo esencial: ?c¨®mo de importante puede llegar a ser la inteligencia artificial aplicada a los contenidos creativos, por ejemplo, en la voz para un podcast? ¡°En el caso de Biotop¨ªa no hemos buscado un tipo de voz demasiado sofisticada, porque la idea es que resulte evidente que esas voces no son humanas, pero es cierto que ya estamos en un momento en el que puedes generar una voz que enga?e a la mayor¨ªa de o¨ªdos. Yo por ahora, despu¨¦s de esta primera experiencia, es un recurso que veo como un complemento, una herramienta m¨¢s, pero al ritmo que evoluciona esta tecnolog¨ªa estoy convencido de que muy pronto ser¨¢ mucho m¨¢s que eso¡±, concluye Bartual.
El futuro de la voz
A la voz y sus enormes posibilidades tecnol¨®gicas y sociales han dedicado dos episodios los creadores de Cat¨¢strofe Ultravioleta, el podcast de divulgaci¨®n cient¨ªfica que gan¨® el Premio Ondas en el a?o 2017 al mejor programa online. Han regresado en plena pandemia para firmar dos de los episodios m¨¢s completos acerca de la relaci¨®n entre inteligencia artificial y voz: ¡°La voz era un tema que ten¨ªamos pendiente desde la primera temporada, cuando grabamos con un coro una de las promos del podcast. Nos apetec¨ªa explorar la idea de que el cuerpo humano es un instrumento musical, jugar con los sintetizadores de Javi ?lvarez, t¨¦cnico y dise?ador sonoro, y tirando del hilo empezamos a adentrarnos en un mundo tecnol¨®gico fascinante, de posibles suplantaciones, reconstrucciones de voces perdidas, etc¡±, explica Antonio Mart¨ªnez Ron, la voz que presenta este podcast junto a Javier Pel¨¢ez.
A trav¨¦s de un doble episodio, Mart¨ªnez Ron y Pel¨¢ez abordan la relaci¨®n entre inteligencia artificial y voz desde dos perspectivas muy diferenciadas: ¡°El primer cap¨ªtulo est¨¢ muy centrado en la posibilidad de que alguien un d¨ªa confunda tu voz con la de otro. Tambi¨¦n en las t¨¦cnicas de ling¨¹¨ªstica forense que se aplican en muchos juicios para determinar a qui¨¦n pertenece una muestra de audio. Pero tambi¨¦n apuntamos a la posibilidad de aplicar la tecnolog¨ªa que ya se usa para hacer deepfakes para suplantar nuestra voz. Y el segundo episodio es el reverso amable y divertido de todo eso, el de la tecnolog¨ªa que te permite generar una voz artificial para componer canciones o para ayudar a personas que han perdido la posibilidad de expresarse por enfermedad¡±, concluye Antonio.
Tras la covid-19, la utilizaci¨®n de aplicaciones de voz y v¨ªdeo han crecido exponencialmente, pero ?de qu¨¦ manera puede afectar a nuestra identidad? ¡°Ya hay grandes compa?¨ªas almacenando nuestras voces y aplicando programas de reconocimiento cuyo uso podr¨ªa tener consecuencias para nuestra privacidad y seguridad en el futuro. Las posibilidades que ofrece la tecnolog¨ªa son enormes, desde tener tu propio avatar de voz para que se encargue de hacer la compra por ti o pedir cita en la peluquer¨ªa pero, al mismo tiempo, aumenta el riesgo de que alguien copie tu voz y acceda a servicios en tu nombre o te meta en un buen l¨ªo¡±, detalla Mart¨ªnez Ron.
Aunque a muchos todo esto les pueda sonar a ciencia ficci¨®n, lo cierto es que la primera voz sint¨¦tica se remonta muy atr¨¢s: ¡°Puede que al siglo XVIII, cuando m¨¦dico alem¨¢n Christian Gottlieb Kratzenstein desarroll¨® una m¨¢quina neum¨¢tica, un mecanismo que cab¨ªa en una caja, que pronunciaba las vocales como si fuera un humano. Mucho m¨¢s adelante, ya en el siglo XX, nos encontramos con el Vocoder de AT&T, una especie de versi¨®n computerizada y con cables de aquellos primeros ¨®rganos voc¨¢licos. Y en 1961, los Laboratorios Bell hicieron una demostraci¨®n hist¨®rica de su tecnolog¨ªa de s¨ªntesis de voz, con un ordenador IBM 7094 que cantaba la canci¨®n Daisy Bell. Se dice que aquel d¨ªa estaba Arthur C. Clarke entre los asistentes a la demostraci¨®n y los cin¨¦filos recordar¨¢n que Daisy Bell es la misma canci¨®n que canta HAL al final de la pel¨ªcula 2001: Una odisea en el espacio. Y as¨ª se cierra ese peque?o c¨ªrculo friqui de la voz sintetizada, ?pero hay muchos detalles m¨¢s que contamos en estos dos cap¨ªtulos!¡±, concluye uno de los tres fundadores de Cat¨¢strofe Ultravioleta.
Reconstruir las voces del pasado
La reconstrucci¨®n de voces del pasado es otra de la variantes m¨¢s interesantes que, sobre todo, puede aplicarse a la historia. Hay algunos cient¨ªficos que han llegado a reconstruir voces a partir de las estructuras anat¨®micas de momias egipcias o de ?tzi, el famoso Hombre de hielo. Para Mart¨ªnez Ron, por ahora, es s¨®lo un divertimento, ¡°pero hay una parte cient¨ªfica muy interesante, como el intento de conocer, por ejemplo, si los primeros humanos ten¨ªan ya capacidad de hablar y c¨®mo lo hac¨ªan, a partir de sus restos f¨®siles¡±.
Y si hablamos de reconstrucciones de voz aplicadas al formato podcast, probablemente, uno de los ¨²ltimos ejemplos es XRey, el podcast producido por The Story Lab, distribuido por Spotify, dirigido y narrador por ?lvaro de C¨®zar y con producci¨®n de Toni Garrido. Este documental sonoro es una radiograf¨ªa exhaustiva de la vida del rey Juan Carlos I. ¡°En el podcast hemos usado inteligencia artificial para hacer la s¨ªntesis dela voz de un personaje. En este caso, Franco. La idea surgi¨® cuando quisimos reproducir la carta que este envi¨® a don Juan en el episodio 4. Pod¨ªamos haberla le¨ªdo solamente o pod¨ªamos haber pedido a un actor o a un imitador que la leyera, pero surgi¨® esta idea que nos abr¨ªa un campo enorme, no solamente para este podcast, sino quiz¨¢ para nuevos proyectos¡±, explica De C¨®zar. Le hicieron el encargo a Vicomtech, un centro tecnol¨®gico en el Pa¨ªs Vasco, y hay un cap¨ªtulo extra en la serie en el que se cuenta c¨®mo se hizo la reconstrucci¨®n.
?lvaro de C¨®zar coincide con Mart¨ªnez Ron en que el riesgo tambi¨¦n puede ser evidente: ¡°Lo importante es que el oyente sepa lo que est¨¢s haciendo. Si avisas antes de que lo que va a escuchar es la s¨ªntesis de la voz de Churchill leyendo sus memorias no est¨¢s enga?ando a nadie. Si, por el contrario, haces que diga cosas que nunca dijo y no avisas, pues entras en un terreno con un mont¨®n de problemas ¨¦ticos. Supongo que el ¨¦xito de esta herramienta para hacer podcast depender¨¢ de c¨®mo se resuelvan esos conflictos¡±, finaliza ?lvaro de C¨®zar.
La idea de escuchar un podcast completo cuyo host sea una voz no humana no es algo descabellado. James Ryan, un estudiante de la Universidad Santa Cruz de California, present¨® esta idea como parte de su tesis doctoral. El podcast se llama Condado de Sheldon.? Tiene como anfitri¨®n y creador a un programa de inteligencia artificial llamado SHELDON, cuyo objetivo es examinar las experiencias de los personajes que viven dentro de los condados estadounidenses en el a?o 1840 y crear historias narrativas basadas en sus experiencias. Se trata casi de un podcast infinito, pues sus tramas est¨¢n generadas autom¨¢ticamente por un software. Los personajes de estos condados tienen sus propias vidas y toman sus propias decisiones. Interact¨²an entre s¨ª e incluso poseen objetivos y sistemas de valores ¨²nicos. SHELDON luego convierte estas historias en un podcast narrativo, inspirado en claramente en Twin Peaks. El futuro est¨¢ mucho m¨¢s cerca de lo que imaginamos. Tambi¨¦n el mundo del podcast.
Lea m¨¢s temas de blogs y s¨ªganos en Flipboard.
Tu suscripci¨®n se est¨¢ usando en otro dispositivo
?Quieres a?adir otro usuario a tu suscripci¨®n?
Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.
FlechaTu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.
En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.