Hablar con la m¨¢quina
La tecnolog¨ªa de reconocimiento de voz transforma nuestro modo de relacionarnos con los dispositivos
Cada 10 a?os cambia la forma en que interactuamos con la tecnolog¨ªa. Primero llegaron los ordenadores de sobremesa, despu¨¦s los buscadores de Internet y en 2007 los tel¨¦fonos inteligentes transformaron nuestra manera de comunicarnos. Pero ?cu¨¢l es el siguiente paso? La respuesta a esa pregunta la dio Phil Schiller, vicepresidente de marketing de Apple, en 2011. ¡°Lo ¨²nico que quer¨ªamos era hablar a nuestros dispositivos, hacerles preguntas sencillas y que nos dieran una respuesta. Quer¨ªamos poder hablar con ellos como con cualquier persona¡±. Efectivamente, el siguiente paso en la evoluci¨®n de la tecnolog¨ªa es la voz.
En aquella comparecencia de 2011, Schiller present¨® al mundo a Siri, el primer asistente virtual activado por voz de la historia. Siete a?os despu¨¦s, 710 millones de personas utilizan y hablan con estos ayudantes 2.0 al menos una vez al mes, seg¨²n la consultora Tractica, y se calcula que en 2018 los ayudantes virtuales alcanzar¨¢n los 1.000 millones de usuarios. El habla es la manera m¨¢s natural que tenemos los humanos de interactuar. Si aplicamos este modo de comunicarnos a nuestra relaci¨®n con los dispositivos electr¨®nicos, el paradigma de la relaci¨®n entre los usuarios y las m¨¢quinas cambiar¨¢ por completo.
Al implantar la voz como interfaz para interactuar con las m¨¢quinas ya no habr¨¢ que esforzarse por entender su funcionamiento, saber d¨®nde clicar para buscar una foto o tener acceso directo al correo en la pantalla principal del tel¨¦fono. Solo tendremos que decir: ¡°Manda un mensaje a mi jefe dici¨¦ndole que llego tarde¡± o ¡°ens¨¦?ame las fotos de mi sobrino¡±. Dicho y hecho. Ser¨¢ un modo de democratizar el acceso a la informaci¨®n y a las nuevas tecnolog¨ªas, eliminando, de paso, la brecha tecnol¨®gica generacional.
Si aplicamos este modo de comunicarnos a nuestra relaci¨®n con los dispositivos electr¨®nicos, el paradigma de la relaci¨®n entre los usuarios y las m¨¢quinas cambiar¨¢ por completo.
Este cambio no ser¨ªa posible sin la tecnolog¨ªa de reconocimiento del lenguaje, que es la capacidad que tienen las m¨¢quinas para procesar la informaci¨®n que les damos a trav¨¦s de la voz. Si se lo pedimos, son capaces de buscar el mejor restaurante de la ciudad o poner el despertador para el d¨ªa siguiente a las nueve de la ma?ana. Esto genera la falsa sensaci¨®n de que el asistente nos entiende y de que sabe a qu¨¦ nos referimos. Nada m¨¢s lejos de la realidad: cada vez que hacemos una pregunta a Google o a Siri, es el ayudante el que convierte nuestra voz en texto y ese texto, a su vez, en lenguaje binario, para as¨ª poder procesar la informaci¨®n y buscar en sus bases de datos la mejor respuesta. Esta tecnolog¨ªa ya est¨¢ completamente desarrollada en ingl¨¦s: diferentes empresas como Google o la consultora Accenture apuntan que la comprensi¨®n del lenguaje natural en este idioma es efectiva en un 95%-99%; mientras que en castellano todav¨ªa queda mucho por mejorar, ya que tan solo es efectiva en un 80%-85%.
La integraci¨®n total del lenguaje natural en los asistentes virtuales nos acerca un poco m¨¢s a aquella promesa que hizo Phil Schiller. Aunque estos ayudantes nunca llegar¨¢n a sustituir una conversaci¨®n con otra persona, algunas empresas est¨¢n creando la ilusi¨®n de que s¨ª es posible a trav¨¦s de aplicaciones como Xiaoice (desarrollado por Microsoft para China). Hay que recordar que las m¨¢quinas no son capaces de entender lo que decimos y que las respuestas que nos dan, ingeniosas, divertidas o cortantes, son fruto de una base de datos preescrita por periodistas, guionistas y ling¨¹istas. No hay ninguna espontaneidad. No son capaces de crear lenguaje.
La combinaci¨®n de estas dos tecnolog¨ªas con el Internet de las cosas ha dado lugar a nuevos artilugios, como la torre de Amazon (m¨¢s conocida como Alexa), el Google Home o el Apple Pod, que prometen hacernos la vida mucho m¨¢s f¨¢cil: desarrollar¨¢n por nosotros tareas tan cotidianas como encender la calefacci¨®n o poner en tu televisi¨®n inteligente tu serie favorita sin que haya que levantarse del sof¨¢. ?C¨®mo? Solamente habr¨¢ que ped¨ªrselo.
Es el par¨¢metro biom¨¦dico m¨¢s seguro. ¡°Con solo decir ¡®mi voz es mi contrase?a¡¯, la maquina reconoce al cliente¡±, explica Marco Pi?a
Las emociones de la voz
El siguiente paso para hacer m¨¢s "real" la relaci¨®n entre seres humanos y m¨¢quinas es que estas ¨²ltimas sean capaces de reconocer las emociones que sienten sus due?os para ofrecer una experiencia m¨¢s completa.
Gemma Garc¨ªa L¨®pez, investigadora internacional de la UCM- Standford University asegura que con el software de reconocimiento de emociones, las m¨¢quinas como los asistentes podr¨ªan ofrecer respuestas dependiendo de los diferentes estados de ¨¢nimo. Por poner un ejemplo pr¨¢ctico, se podr¨ªa preguntar a Siri qu¨¦ estrenos hay para hoy y si detectase que el usuario est¨¢ triste podr¨ªa sugerir en primer lugar algunas comedias.
Aunque la aplicaci¨®n de esta clase de softwares es muy complejo, ya que la fugacidad de las emociones hace que sea complicado establecer un patr¨®n que se mantenga en el tiempo, como pueden ser por ejemplo los gustos del due?o del asistente, matiza Garc¨ªa L¨®pez.
Estas torres cuentan con una serie de micr¨®fonos que est¨¢n constantemente ¡°escuchando¡± lo que ocurre a su alrededor y en el momento en el que captan el comando de activaci¨®n se ponen a nuestro servicio. El primero de los dilemas que plantean estos aparatos es ?qu¨¦ pasa con mi privacidad? ?D¨®nde van todas esas conversaciones que mi asistente escucha a lo largo del d¨ªa? ¡°Son desechadas¡±, asegura Behshad Behzadi, uno de los ingenieros principales de Google Assistant, en videoconferencia desde la sede de la empresa en Z¨²rich, ¡°aunque el asistente est¨¦ todo el d¨ªa escuchando, esa informaci¨®n no se env¨ªa a ninguna parte. El ayudante de Google solo se activa en el momento en el que dices ¡®Ok Google¡¯ y a partir de ah¨ª s¨ª que recoge tus peticiones y las env¨ªa¡±. Una parte de su retentiva es privada, y solo se utiliza para almacenar datos personales de su due?o.
Gracias a esta memoria pueden saber cu¨¢l es nuestro equipo de f¨²tbol favorito, d¨®nde vivimos o en qu¨¦ empresa trabajamos. Nuestros dispositivos inteligentes tendr¨¢n pronto un acceso total a nuestra vida y a nuestra informaci¨®n.
Entonces, ?qu¨¦ pasa con nuestros datos? ?Qui¨¦n tendr¨¢ acceso a ellos? ?D¨®nde los alojar¨¢n las grandes empresas? ?Podr¨¢n ser hackeados? Son algunas de las preguntas que surgen cuando se habla de informaci¨®n personal. En principio, seg¨²n explica Isabel Fern¨¢ndez, directora general de Accenture Analytics, ¡°no ser¨¢ posible acceder a los datos personales de los usuarios porque solo se compartir¨¢n los comandos que se utilizan para pedirle cosas al asistente y siempre de manera an¨®nima¡±.
La seguridad es otro de los campos en los que la tecnolog¨ªa de reconocimiento de voz promete ser relevante. ¡°La voz, al igual que las huellas dactilares, es ¨²nica en cada persona¡±, explica Marco Pi?a, director de Nuance Enterprise Iberia en una entrevista en la sede de la empresa en Madrid. Esta caracter¨ªstica permite que se pueda emplear como elemento de seguridad para, por ejemplo, poder hacer transacciones con el banco sin necesidad de contrase?as. ¡°Esta tecnolog¨ªa ya est¨¢ implantada en varios pa¨ªses de Am¨¦rica Latina y en Reino Unido, y es muy efectiva. La voz es el par¨¢metro biom¨¦trico m¨¢s seguro, y con solo decir ¡®mi voz es mi contrase?a¡¯, la m¨¢quina detecta que el cliente es quien est¨¢ hablando y da luz verde a la operaci¨®n¡±.
Nada, o casi nada, puede enga?ar a estos softwares de reconocimiento de voz, ni siquiera una grabaci¨®n de alt¨ªsima calidad. ¡°Cuando hablamos, nuestra voz emite una serie de par¨¢metros que son ¨²nicos. Cuando esa voz es reproducida despu¨¦s de ser grabada, esos par¨¢metros var¨ªan, de una manera m¨ªnima, pero var¨ªan, y el programa reconoce que no est¨¢ hablando con una persona real. Pero para asegurarse, pide que repita otra frase aleatoria. Es imposible que nadie tenga todas las frases del mundo grabadas, por lo que no se puede enga?ar al software¡±.
Al igual que en la pel¨ªcula Her, donde un hombre acaba enamorado de la voz de su m¨¢quina, podremos mantener conversaciones con nuestros asistentes personales, nos recordar¨¢n que nos toca tomar la medicaci¨®n e incluso parecer¨¢ que nos escuchan cuando les contemos que hemos tenido un mal d¨ªa.
Pero siempre habr¨¢ que tener en cuenta que detr¨¢s de esa voz que nos responde desde el iPhone o el Google Home solo hay unos y ceros siendo procesados a gran velocidad.
Tu suscripci¨®n se est¨¢ usando en otro dispositivo
?Quieres a?adir otro usuario a tu suscripci¨®n?
Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.
FlechaTu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.
En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.