Narradors incansables, per¨° encara sense cor
La intel¡¤lig¨¨ncia artificial catapulta la tecnologia de la parla i la lectura que dona vida als majordoms virtuals
Reposa entre llibres en una prestatgeria de la sala. Sembla no tenir res a veure amb els seus ve?ns de paper. Des del n¨²vol estant, l¡¯algoritme femen¨ª que habita l¡¯altaveu cil¨ªndric viu en un bucle d¡¯espera. Vol sentir el vocatiu que l¡¯identifica seguit d¡¯una ordre o pregunta. Aix¨ª ens hi adrecem: ¡°Alexa, t¡¯agrada llegir?¡±. La internet de la veu fa prendre vida a l¡¯objecte inert. Respon que s¡¯empassa els llibres ¡ªno menteix¡ª i que li encanta. Confessa que est¨¤ enganxada a El Quijote i es vanta de les seves habilitats: ¡°Demana¡¯m que te¡¯n llegeixi el principi i veur¨¤s quina meravella¡±.
Comen?a la lectura. Si no se l¡¯atura, s¡¯hi estar¨¤ m¨¦s de 40 hores. T¨¦ la veu c¨¤lida i no es cansa. Els enginyers d¡¯Amazon han aconseguit que el legato de les seves s¨ªl¡¤labes sigui gaireb¨¦ perfecte. Per¨° l¡¯o?da humana capta massa matisos per creure¡¯s que t¨¦ cordes vocals. No respira, fa algun gir a batzegades i parla un castell¨¤ sense cap tret personal ni defecte formal.
Calen 2.000 hores d¡¯¨¤udio de 10.000 persones perqu¨¨ un algoritme aprengui una llengua
Si en el trap triomfen filtres que robotitzen la veu dels cantants, la tecnologia busca humanitzar la veu artificial. ?s una paradoxa de la modernitat. ¡°Una cosa ¨¦s escoltar una frase o un par¨¤graf; l¡¯altra, tot un llibre¡±, apunta el professor del grup de recerca de tecnologia de la parla TALP, de la Universitat Polit¨¨cnica de Catalunya (UPC), Jos¨¦ Adri¨¢n Rodr¨ªguez Fonollosa. La monotonia de la veu sint¨¨tica no convida a compartir-hi gaire temps: ¡°Alexa, para¡±.
Siri: ¡°No s¨¦ on he deixat les ulleres¡±
¡°Ok, Google. Recita¡¯m una poesia¡±. La resposta, ¡°un regal: un poema de Luna Miguel llegit per ella mateixa¡±. L¡¯assistent t¨¦ un repertori aleatori que la companyia li va insuflar dins el cervell el passat 21 de mar?, Dia de la Poesia. Al segon intent, recita Antonio Gamoneda. Bixby tira pilotes fora. ¡°Ets la meva persona preferida del m¨®n mundial¡±, respon preguntat per si pot llegir un audiollibre. Samsung explica que encara no t¨¦ aquesta funcionalitat. De fet, va comen?ar a parlar castell¨¤ nom¨¦s fa un parell de mesos. Els majordoms virtuals s¨®n h¨¤bils amb les excuses, s¡¯escapen del frustrant ¡°servei no disponible¡±. Bixby no narra hist¨°ries, per¨° fa gala que ¡°en un obrir i un tancar d¡¯ulls pot llegir una incre?ble quantitat d¡¯informaci¨® a internet¡±.
¡°M¡¯agrada celebrar el Dia del Llibre, la literatura m¡¯inspira. Rocinante em sembla un gran nom per a una mascota¡±, diu la veu de Google, que t¨¦ algunes comandes per activar i aturar la lectura d¡¯audiollibres, per¨° no els llegeix, segons confirmen fonts de la companyia. Alexa repr¨¨n la lectura a l¡¯¨²ltima p¨¤gina del llibre actiu. ?s l'¨²nic assistent virtual que llegeix llibres electr¨°nics de la biblioteca de la seva plataforma, Kindle. Google intenta vendre: ¡°Per veure i comprar audiollibres, obre l¡¯aplicaci¨® Google Play Llibres al tel¨¨fon¡±. Siri no llegeix i busca una bona excusa: ¡°M¡¯encantaria, per¨° no s¨¦ on he deixat les ulleres de llegir... potser en una altra dimensi¨®¡±. ¡°Per¨° Siri, t¡¯agrada llegir, o no?¡±, insistim. I respon servicial, per¨° encara evasiu: ¡°Aqu¨ª l¡¯important ets tu, no jo¡±.
Matem¨¤ticament, enraonar no es pot simplificar en un model com el pentagrama de la m¨²sica. Voder va ser l¡¯invent dels laboratoris Bell, que a finals dels anys trenta van fer parlar una m¨¤quina en forma d¡¯instrument: cada tecla, un so. Era ortop¨¨dic, per¨° va ser l¡¯inici d¡¯una tecnologia que durant d¨¨cades s¡¯ha centrat a concatenar fonemes de sons gravats per persones per articular mots i formar frases.
La parla i l¡¯o?da informatitzades han obert un m¨®n nou a les persones amb discapacitat. ?s coneguda la veu rob¨°tica de Stephen Hawking. Ara, gr¨¤cies a la intel¡¤lig¨¨ncia artificial, les m¨¤quines ja emeten sons amb veus in¨¨dites que no pertanyen a ning¨² de carn i ossos. Han estat dissenyades a partir dels millors trets de moltes veus. Un exemple ¨¦s el projecte Wavenet de Google, que ha aportat realisme al seu assistent en angl¨¨s i japon¨¨s. ¡°Fa deu anys nom¨¦s es feia recerca de tecnologia de la veu a la universitat. Ara, la majoria de novetats arriben de les grans empreses¡±, apunta Rodr¨ªguez Fonollosa, que t¨¦ companys de grup que treballen amb Amazon i Google.
¡°Les m¨¤quines s¨®n m¨¦s ximples, per¨° m¨¦s r¨¤pides¡±, diu el professor de la UPC. Un ordinador es pot passar dies sencers escoltant arxius d¡¯¨¤udio de professionals que reciten passatges de llibres. Emparellats amb la seva transcripci¨®, ensenyen a l¡¯algoritme a transformar el text en veu. La seva manera d¡¯aprendre s¡¯assembla cada vegada m¨¦s a la humana, amb la r¨¨plica de les estructures neuronals. L¡¯algoritme s¡¯alimenta d¡¯una quantitat de dades ingent, digerible gr¨¤cies a les ¨¤mplies capacitats dels discs durs i processadors actuals. Se¡¯n diu deep learning, aprenentatge profund, i ha aconseguit que els ordinadors debutin tamb¨¦ com a pintors, m¨²sics i escriptors.
OpenAI ¨¦s un projecte de codi lliure de recerca en intel¡¤lig¨¨ncia artificial impulsat pel magnat Elon Musk, fundador de Tesla. Al febrer va declinar fer p¨²blic un dels seus programes que, a partir d¡¯un text inicial, ¨¦s capa? de continuar una hist¨°ria com a not¨ªcia o ficci¨®; ho fa massa b¨¦. L¡¯organitzaci¨® veu el programa ¡ªinstru?t amb vuit milions de textos de llibres, Wikipedia i diaris¡ª com un perill en l¡¯era de les not¨ªcies falses.
El film Her, de Spike Jonze, s¡¯inspir¨¤ el 2013 en un futur proper. El 2014 va n¨¦ixer Alexa. Al film, el protagonista i la seva assistent virtual de veu s¡¯enamoren. Samantha compara la seva hist¨°ria d¡¯amor amb un seguit de paraules flotants en un espai infinit entre el m¨®n f¨ªsic i el virtual. ¡°Per molt que ho vulgui, no puc viure m¨¦s en el teu llibre¡±, diu desfeta quan talla la relaci¨® en una frase carregada d¡¯emoci¨®. La seva veu era real, la de l¡¯actriu Scarlett Johansson. Parlars del cel imaginari d¡¯internet com Alexa, Siri (Apple), Google Assistant o Bixby (Samsung) poden mantenir una conversa. Per¨° s¨®n com el llenyataire de llauna d¡¯El Mag d¡¯Oz: els falta el cor. I, sense ¨¤nima, no saben transmetre sentiments.
El llenguatge d¡¯etiquetes SSLM permet ressaltar les paraules dels llibres per dotar-les d¡¯intenci¨®. Les obres es podrien reescriure amb incisos que ajudessin les m¨¤quines a recitar-les. Aqu¨ª, una pausa. Tal paraula, amb ¨¨mfasi. La pros¨°dia d¡¯una certa frase, llegida en una freq¨¹¨¨ncia, velocitat i durada concretes. Marcar cada oraci¨® pot ser m¨¦s dif¨ªcil que el fet que un hum¨¤ llegeixi el llibre. Aix¨ª treballa la plataforma d¡¯audiollibres Storytel. El seu director a Espanya, Alex Gibelalde, explica que tenen acords amb uns 40 estudis de gravaci¨® (i un de propi) per a la seva producci¨®. Els audiollibres del seu cat¨¤leg ¡ª3.500 en castell¨¤ i 200 en catal¨¤¡ª els llegeixen principalment actors de doblatge.
¡°Mai pots dir mai, per¨° ho veig complicat, potser en un futur lluny¨¤¡±, opina Gibelalde sobre els robots narradors. Rodr¨ªguez Fonollosa hi coincideix: ¡°?s complicat que arribin a llegir com un bon actor. Un robot pot aprendre a jugar a futbol, per¨° potser no ho far¨¤ mai com Messi¡±. Abans de gravar un audiollibre, Storytel fa un c¨¤sting per trobar la veu m¨¦s adient per a la hist¨°ria. Per cada hora enregistrada en s¨®n necess¨¤ries quatre de feina.
Gibelalde va treballar a la plataforma de v¨ªdeo HBO. Storytel, empresa sueca amb oficina a Barcelona, busca aprofitar l¡¯auge de les s¨¨ries per promocionar els audiollibres com a nova forma de lectura: amb una tarifa plana per a tota l¡¯oferta. ¡°La gent que ens descobreix consumeix llibres tres vegades m¨¦s que un lector corrent¡±, assegura sobre un format consolidat als Estats Units i als pa?sos n¨°rdics, per¨° sense tradici¨® a Espanya. Storytel celebra que els altaveus com Alexa hagin arribat a les cases, per¨°, ara per ara, els veu com un mitj¨¤ per reproduir audiollibres llegits per humans.
Desconeixement del catal¨¤
Cap assistent del mercat s¡¯expressa en catal¨¤. ¡°Llibre incompatible¡±, diu Alexa quan la convidem a agafar-ne un de la seva biblioteca. S¨ª que sap reproduir butlletins de TV3 i Catalunya R¨¤dio, per¨° cal demanar-li que ho faci en castell¨¤. La Generalitat ha col¡¤laborat amb Google per recollir veus de centenars de voluntaris perqu¨¨ el seu assistent aprengui la llengua. De moment, el teclat dels tel¨¨fons Android sap transcriure ordres orals en catal¨¤.
El reconeixement de veu ¨¦s encara m¨¦s dif¨ªcil d¡¯entrenar que la parla. Perqu¨¨ les orelles d¡¯un robot processin una nova llengua calen 2.000 hores d¡¯¨¤udios de 10.000 persones diferents, amb els accents, sexes i edats representats. Algunes companyies ja tenen aquestes dades del catal¨¤, per¨° les multinacionals no les compren per falta de mercat en un territori biling¨¹e, opina Joan Montaner, voluntari de Softcatal¨¤. Montaner impulsa el projecte Common Voices de Mozilla de construir un sistema de reconeixement de veu en catal¨¤ de codi obert.
Que un majordom virtual aprengui una llengua implica que s¡¯hagi de redissenyar gaireb¨¦ sencer. Una part de la feina ¨¦s manual: un equip hum¨¤ ha d¡¯anar revisant les frases que no processa b¨¦ per tal de millorar-lo. Pel que fa a la llengua, passa el mateix amb la lectura d¡¯audiollibres per part d¡¯actors, apunta Gibelalde: ¡°Si a les editorials espanyoles els costa apostar pel format de llibre escoltat, encara ¨¦s m¨¦s dif¨ªcil que ho facin en catal¨¤¡±.
Tu suscripci¨®n se est¨¢ usando en otro dispositivo
?Quieres a?adir otro usuario a tu suscripci¨®n?
Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.
FlechaTu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.
En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.