Charlar y sonre¨ªr con asistentes virtuales
La consultora tecnol¨®gica Everis ahonda en la pr¨®xima frontera de la inteligencia artificial: conversaciones humanas y emp¨¢ticas con m¨¢quinas
Al otro lado del tel¨¦fono, una voz c¨¢lida que recibe las preguntas, como ha ocurrido toda la vida. Pero esa voz no sale de una garganta humana. Ha sido dise?ada por orfebres de todas las disciplinas para cumplir un doble cometido: resolver las consultas del cliente y fidelizarlo.
Aunque suene a futuro, Marcos Obed, director del ¨¢rea de Experiencia Digital y responsable de los Servicios Conversacionales Europa en la consultora tecnol¨®gica Everis, parte del Grupo NTT DATA, insiste en que estamos hablando ya de una realidad palpable. Su compa?¨ªa, por ejemplo, ofrece soluciones tecnol¨®gicas como eva, una plataforma de bots para actuar como centro de atenci¨®n para los clientes. Tanto de manera escrita como hablada, los bots pueden asumir millones de clientes y analizar datos de sus conversaciones para perfeccionarse en el tiempo como asistentes virtuales. Es una muestra de un mercado gigantesco, que crecer¨¢ a una media del 37,7% de aqu¨ª a 2027 hasta superar los 36.000 millones de euros, seg¨²n datos de Grand View Research.
La capa tecnol¨®gica que hace posible a esta nueva generaci¨®n de asistentes virtuales no es nueva. Es tan vieja como la humanidad: el habla. El lenguaje natural, m¨¢s precisamente, su creaci¨®n mediante medios tecnol¨®gicos ¡ªuna disciplina de la inteligencia artificial conocida como NLP (Procesamiento de Lenguajes Naturales)¡ª, es el punto de partida. En conjunci¨®n con otra capacidad humana, la visi¨®n. ¡°De lo que estamos hablando, en cuanto a asistentes virtuales, es de la capacidad de interpretar las emociones de un cliente cuando este habla con el asistente. Y no algo tan simple como ¡®este est¨¢ alegre o enfadado¡¯. Hablamos de composiciones tan complejas como detectar si una persona est¨¢ nost¨¢lgica¡±, apunta Obed.
La velocidad de computaci¨®n ha sido el gran salto tecnol¨®gico en el sector. Del machine learning y el deep learning se ha pasado, desde 2017, a los modelos transformer, que han tenido un impacto clave en abordar tareas como la traducci¨®n. ¡°Google T5, por ejemplo, est¨¢ entrenado con 11 billones de par¨¢metros. GPT-3 alcanza los 175 billones, despu¨¦s de hacer un web-scraping ¡ªt¨¦cnica de extracci¨®n de informaci¨®n de internet mediante software automatizado que emula la navegaci¨®n digital de una persona¡ª a Wikipedia entre otras fuentes. Significa que, b¨¢sicamente, es capaz de contestarte de todo. Esto nos permite visualizar los grandes cambios que habr¨¢ en nuestras relaciones con las m¨¢quinas¡±, resume Obed.
Otra de las tecnolog¨ªas clave en el ramo son las redes de traducci¨®n autom¨¢tica neuronal, que han pasado de las voces rob¨®ticas generadas por fonemas a sintetizar directamente ondas de sonido que el o¨ªdo humano percibe como una voz genuina.
La creaci¨®n de asistentes virtuales no est¨¢ centrada en la tecnolog¨ªa, sino en la experiencia de usuarios. Nuestros dise?adores de conversaci¨®n vienen de humanidadesMarcos Obed, directivo de Everis, del Grupo NTT DATA
El impacto para las compa?¨ªas de este tipo de asistentes virtuales es enorme. En primer lugar, en lo obvio, reducir el gran coste de las centralitas para la asistencia a los clientes. Pero m¨¢s all¨¢ de este recorte de costes, est¨¢ el calibrar de una manera mucho m¨¢s precisa qu¨¦ experiencia se le quiere ofrecer al usuario para fidelizarlo. En ese objetivo, juegan un papel clave los equipos multidisciplinares donde las humanidades encuentran un sorprendente lugar central en el seno tecnol¨®gico. ¡°Parte importante de nuestros equipos para la creaci¨®n de estos asistentes virtuales no est¨¢n centrados en la tecnolog¨ªa, sino en la experiencia de usuarios. Nuestros profesionales, a los que llamamos dise?adores de conversaci¨®n, vienen de disciplinas como la filosof¨ªa, las humanidades y la ling¨¹¨ªstica. De hecho, nosotros, con las marcas que nos contratan, no hablamos de la tecnolog¨ªa, sino de contar una historia, porque la voz del asistente virtual va a ser su voz de cara al cliente¡±, asevera Obed.
El impacto de estas tecnolog¨ªas va a llegar mucho m¨¢s all¨¢ de la relaci¨®n cliente-empresa. La Universidad de Cambridge publicaba ya en enero de 2017 un amplio art¨ªculo recopilatorio de todas las tecnolog¨ªas de lenguaje de proceso natural y su impacto en la salud mental. Pero tambi¨¦n un proceso tan clave y delicado como la entrevista de trabajo se puede ver afectado por esta tecnolog¨ªa revolucionaria que podr¨ªa actuar como un pol¨ªgrafo preciso para evaluar al candidato. ¡°Nosotros ya hemos tenido alguna experiencia piloto en este sentido. Aunque, efectivamente, esto va a requerir una legislaci¨®n que defina el marco legal y proteja la privacidad de las personas en todos los ¨¢mbitos de su interacci¨®n con las m¨¢quinas¡±, apostilla Obed. Un marco que deber¨¢ acelerar su implantaci¨®n para dar respuesta a una tecnolog¨ªa de evoluci¨®n imparable y consecuencias profundas: en 2024 habr¨¢ 8.400 millones de dispositivos con asistentes de voz. Es decir, un n¨²mero an¨¢logo (de facto, ligeramente mayor) a la poblaci¨®n mundial.
Cibercr¨ªmenes de la voz
En septiembre de 2019, The Wall Street Journal informaba de un incre¨ªble caso de cibercrimen. El CEO de una compa?¨ªa brit¨¢nica recibi¨® una supuesta llamada de su jefe ¡ªla v¨ªctima asegur¨® haber reconocido la musicalidad y acento alem¨¢n de su superior¡ª para transferir ¡°en el plazo de una hora¡± 220.000 euros. Pero lo que escuch¨®, en realidad, era una voz artificial creada mediante lenguaje natural, que confirm¨® las predicciones de los expertos en ciberseguridad sobre el nuevo coto de caza en los cr¨ªmenes de suplantaci¨®n. ¡°Llegaremos al momento en el que se pueda reemplazar artificialmente tu voz y habr¨¢ que anteponerse a estas situaciones. Lo mismo pasaba con el computer vision, se le pod¨ªa enga?ar en un principio empleando una foto para que la reconociera como el usuario. Pero se avanz¨® para exigir tambi¨¦n el movimiento de la persona durante la autenticaci¨®n. Con la voz, tendr¨¢ que suceder lo mismo, porque esto es lo de siempre: los criminales van por delante¡±.