_
_
_
_

Marta Costa-Juss¨¤, investigadora: ¡°El lenguaje tiene muchas sutilezas que la IA no puede captar¡±

La ingeniera catalana forma parte de un equipo de cient¨ªficos de Meta que ha desarrollado una herramienta pionera capaz de traducir autom¨¢ticamente 200 idiomas en tiempo real

La investigadora Marta Costa-Juss¨¤ en Annecy, Francia, en una imagen cedida por ella.
La investigadora Marta Costa-Juss¨¤ en Annecy, Francia, en una imagen cedida por ella.
Manuel G. Pascual

Meta present¨® en 2022 un revolucionario traductor autom¨¢tico capaz de desenvolverse en 200 idiomas. Las traducciones se realizan en tiempo real y con una efectividad muy por encima de la media. ¡°Para dar una idea de la escala del programa, el modelo de 200 idiomas analiza m¨¢s de 50.000 millones de par¨¢metros. Lo hemos entrenado usando el Research SuperCluster, uno de los superordenadores m¨¢s r¨¢pidos del mundo¡±, dijo el consejero delegado y fundador de la empresa, Mark Zuckerberg, cuando se present¨®.

Detr¨¢s de este pionero desarrollo est¨¢ Marta R. Costa-Juss¨¤ (Sabadell, 42 a?os), investigadora del equipo FAIR (Facebook Artificial Intelligence Research), uno de los laboratorios m¨¢s potentes del mundo en inteligencia artificial (IA). Costa-Juss¨¤ forma parte de la treintena de cient¨ªficos ¡ªentre los que hay ingenieros como ella, pero tambi¨¦n ling¨¹istas, cient¨ªficos de datos, soci¨®logos o expertos en ¨¦tica¡ª que ha desarrollado este modelo llamado NLLB-200 (acr¨®nimo de No Language Left Behind: en ingl¨¦s, ning¨²n idioma se queda atr¨¢s). La catalana es una de las coordinadoras de un art¨ªculo firmado recientemente junto a sus colegas en la revista Nature en el que desgranan los detalles de su herramienta.

Costa-Juss¨¤ trabaja en FAIR desde 2022. Ingeniera de Telecomunicaciones por la Universitat Polit¨¨cnica de Catalunya (UPC), se doctor¨® en ese mismo centro y luego hizo estancias postdoctorales en Par¨ªs, S?o Paulo, Ciudad de M¨¦xico, Singapur o Edimburgo. Siempre en torno a su tema: la traducci¨®n autom¨¢tica. Cuando se estableci¨® en Barcelona, donde hab¨ªa conseguido por fin plaza fija en la UPC, recibi¨® un email de Meta. La quer¨ªan para su proyecto NLLB-200. ¡°Me pill¨® justo cuando hab¨ªa conseguido estar donde siempre hab¨ªa querido estar, pero tras hacer las entrevistas, no lo dud¨¦: el equipo era buen¨ªsimo y el proyecto, muy interesante¡±, explica por videollamada desde Par¨ªs, donde vive desde entonces. Adem¨¢s de investigar, Costa-Juss¨¤ disfruta cont¨¢ndole cuentos a sus tres hijos, lo que la llev¨® a publicar el a?o pasado una novela juvenil en la que mezcla aventuras y divulgaci¨®n sobre IA.

Pregunta. ?Qu¨¦ tiene de especial su traductor comparado con otros?

Respuesta. Hemos desarrollado el primer sistema de traducci¨®n en tiempo real que funciona en 200 lenguas. La gracia es que se pueden hacer traducciones entre cualquier pareja de lenguas de esas 200, sin tener que pasar por el ingl¨¦s, como suele suceder. Y la calidad de la traducci¨®n es la mejor que se puede obtener actualmente. Todav¨ªa hoy, despu¨¦s de dos a?os, nuestro sistema se usa como referencia en muchos art¨ªculos cient¨ªficos.

P. ?C¨®mo lo han conseguido?

R. De forma resumida, el sistema funciona tras procesar traducciones paralelas. Me explico. Tienes documentos en muchas parejas de idiomas, alineados a nivel de frase. Por ejemplo, tengo una frase en catal¨¢n y su correspondiente traducci¨®n en ingl¨¦s o mandar¨ªn. Cuando tienes una gran cantidad de esos textos, los insertas en un modelo neuronal de aprendizaje profundo y el algoritmo extrae patrones. A partir de ah¨ª, el sistema aprende a generalizar. Entonces se produce un proceso extraordinario: emerge una especie de conocimiento tras haber visto tantos datos, y eso permite, por ejemplo, que se hagan traducciones directas de catal¨¢n a yoruba, aunque no tengamos textos paralelos en esos dos idiomas en particular, y, por tanto, el sistema no pueda haber aprendido esa traducci¨®n. Eso es posible porque la herramienta aprende a generalizar entre parejas de textos y a extrapolarlo a otras casu¨ªsticas de las que no tiene ejemplos.

P. ?Esto c¨®mo se hace?

R. Con muchos datos, un gran poder computacional y un algoritmo matem¨¢tico capaz de compaginar todo esto. B¨¢sicamente, tienes una frase de entrada, de la que haces una representaci¨®n matem¨¢tica. Transformas las frases en vectores matem¨¢ticos, y esos vectores matem¨¢ticos se transforman en frases de salida. Todo pasa por un espacio altamente multidimensional. Evidentemente, necesitas un gran poder computacional porque, para que el sistema pueda generalizar, necesita millones y millones de frases paralelas. Nuestra aportaci¨®n original ha sido desarrollar una herramienta capaz de digerir todos esos ejemplos.

P. Dice que necesitan millones de frases paralelas. ?Pero qu¨¦ pasa cuando no hay corpus tan extensos, como en swahili u otras lenguas poco digitalizadas?

R. Hemos rastreado internet y hemos desarrollado un algoritmo que es capaz de paralelizar textos, de encontrar entre los datos abiertos de internet qu¨¦ textos son la traducci¨®n de otros. Esa fase de extracci¨®n de datos es autom¨¢tica. Aparte de eso, como dices, hay parejas de idiomas para los que no tenemos corpus, y lo hemos tenido que desarrollar nosotros: hemos pagado a traductores para que traduzcan ciertas frases para ciertos idiomas.

P. ?De d¨®nde han extra¨ªdo el corpus ling¨¹¨ªstico? ?Han recurrido solo a fuentes abiertas?

R. Una de las cosas que me gustan de FAIR es que nuestra investigaci¨®n es abierta, y puedes ver nuestras fuentes. Est¨¢ especificado en el art¨ªculo y en nuestro repositorio: Parlamento Europeo, ONU¡­ Son fuentes disponibles y que la comunidad de traductores lleva mucho tiempo utilizando. La Wikipedia tiene textos paralelos, pero nosotros usamos frases paralelas. Con todo, de ah¨ª hemos sacado mucho.

P. ?Cu¨¢l es el siguiente paso?

R. Ahora lo que queremos es dar el salto a traducir texto a texto. Tambi¨¦n estamos ya con los traductores de voz a voz, que presentamos el a?o pasado. No solo traducen, sino que adem¨¢s mantienen tu tono de voz y tu expresividad. De momento cubre 100 idiomas de entrada y una treintena de salida.

P. ?Hasta d¨®nde pueden llegar? ?Acabar¨¢n alg¨²n d¨ªa con las barreras de los idiomas?

R. Estos sistemas son muy ¨²tiles en muchas situaciones, por ejemplo si est¨¢s perdido en China y nadie habla ingl¨¦s. Pero nosotros ofrecemos traducci¨®n, no interpretaci¨®n. La magia de los int¨¦rpretes es que cogen tu mensaje, lo resumen y lo plasman en otro idioma con total fluidez. De la interpretaci¨®n estamos lejos todav¨ªa. El lenguaje tiene muchas sutilezas y emociones que de momento no podemos cubrir.

P. En los ¨²ltimos meses, se han presentado herramientas de IA generativa multimodal capaces de reconocer objetos de su entorno a trav¨¦s de visi¨®n computacional. ?Qu¨¦ panorama abre esto para la traducci¨®n autom¨¢tica?

R. S¨ª, vamos para all¨¢, hacia sistemas que sean totalmente multimodales [que procesan, texto, imagen, v¨ªdeo y audio]. Eso lo tenemos con Llama 3 [el ¨²ltimo modelo de IA generativa de Meta]. El conocimiento del mundo, de las culturas, del vocabulario espec¨ªfico, del contexto¡­ eso lo tienen los int¨¦rpretes, pero no las m¨¢quinas. Nuestras traducciones se limitan al texto o la voz que insertamos.

P. ?Hay planes de a?adir m¨¢s idiomas?

R. Hemos sacado gu¨ªas para insertar nuevas lenguas en el modelo, que es abierto. No lo tenemos que hacer necesariamente nosotros, lo puede hacer la comunidad cient¨ªfica. Nosotros nos ocupamos de que, quienes quieran, puedan hacerlo.

Puedes seguir a EL PA?S Tecnolog¨ªa en Facebook y X o apuntarte aqu¨ª para recibir nuestra newsletter semanal.

Tu suscripci¨®n se est¨¢ usando en otro dispositivo

?Quieres a?adir otro usuario a tu suscripci¨®n?

Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.

?Por qu¨¦ est¨¢s viendo esto?

Flecha

Tu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.

Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.

En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.

Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.

Sobre la firma

Manuel G. Pascual
Es redactor de la secci¨®n de Tecnolog¨ªa. Sigue la actualidad de las grandes tecnol¨®gicas y las repercusiones de la era digital en la privacidad de los ciudadanos. Antes de incorporarse a EL PA?S trabaj¨® en Cinco D¨ªas y Retina.
Rellena tu nombre y apellido para comentarcompletar datos

M¨¢s informaci¨®n

Archivado En

Recomendaciones EL PA?S
Recomendaciones EL PA?S
Recomendaciones EL PA?S
_
_
seductrice.net
universo-virtual.com
buytrendz.net
thisforall.net
benchpressgains.com
qthzb.com
mindhunter9.com
dwjqp1.com
secure-signup.net
ahaayy.com
tressesindia.com
puresybian.com
krpano-chs.com
cre8workshop.com
hdkino.org
peixun021.com
qz786.com
utahperformingartscenter.org
worldqrmconference.com
shangyuwh.com
eejssdfsdfdfjsd.com
playminecraftfreeonline.com
trekvietnamtour.com
your-business-articles.com
essaywritingservice10.com
hindusamaaj.com
joggingvideo.com
wandercoups.com
wormblaster.net
tongchengchuyange0004.com
internetknowing.com
breachurch.com
peachesnginburlesque.com
dataarchitectoo.com
clientfunnelformula.com
30pps.com
cherylroll.com
ks2252.com
prowp.net
webmanicura.com
sofietsshotel.com
facetorch.com
nylawyerreview.com
apapromotions.com
shareparelli.com
goeaglepointe.com
thegreenmanpubphuket.com
karotorossian.com
publicsensor.com
taiwandefence.com
epcsur.com
mfhoudan.com
southstills.com
tvtv98.com
thewellington-hotel.com
bccaipiao.com
colectoresindustrialesgs.com
shenanddcg.com
capriartfilmfestival.com
replicabreitlingsale.com
thaiamarinnewtoncorner.com
gkmcww.com
mbnkbj.com
andrewbrennandesign.com
cod54.com
luobinzhang.com
faithfirst.net
zjyc28.com
tongchengjinyeyouyue0004.com
nhuan6.com
kftz5k.com
oldgardensflowers.com
lightupthefloor.com
bahamamamas-stjohns.com
ly2818.com
905onthebay.com
fonemenu.com
notanothermovie.com
ukrainehighclassescort.com
meincmagazine.com
av-5858.com
yallerdawg.com
donkeythemovie.com
corporatehospitalitygroup.com
boboyy88.com
miteinander-lernen.com
dannayconsulting.com
officialtomsshoesoutletstore.com
forsale-amoxil-amoxicillin.net
generictadalafil-canada.net
guitarlessonseastlondon.com
lesliesrestaurants.com
mattyno9.com
nri-homeloans.com
rtgvisas-qatar.com
salbutamolventolinonline.net
sportsinjuries.info
wedsna.com
rgkntk.com
bkkmarketplace.com
zxqcwx.com
breakupprogram.com
boxcardc.com
unblockyoutubeindonesia.com
fabulousbookmark.com
beat-the.com
guatemala-sailfishing-vacations-charters.com
magie-marketing.com
kingstonliteracy.com
guitaraffinity.com
eurelookinggoodapparel.com
howtolosecheekfat.net
marioncma.org
oliviadavismusic.com
shantelcampbellrealestate.com
shopleborn13.com
topindiafree.com
v-visitors.net
djjky.com
053hh.com
originbluei.com
baucishotel.com
33kkn.com
intrinsiqresearch.com
mariaescort-kiev.com
mymaguk.com
sponsored4u.com
crimsonclass.com
bataillenavale.com
searchtile.com
ze-stribrnych-struh.com
zenithalhype.com
modalpkv.com
bouisset-lafforgue.com
useupload.com
37r.net
autoankauf-muenster.com
bantinbongda.net
bilgius.com
brabustermagazine.com
indigrow.org
miicrosofts.net
mysmiletravel.com
selinasims.com
spellcubesapp.com
usa-faction.com
hypoallergenicdogsnames.com
dailyupdatez.com
foodphotographyreviews.com
cricutcom-setup.com
chprowebdesign.com
katyrealty-kanepa.com
tasramar.com
bilgipinari.org
four-am.com
indiarepublicday.com
inquick-enbooks.com
iracmpi.com
kakaschoenen.com
lsm99flash.com
nana1255.com
ngen-niagara.com
technwzs.com
virtualonlinecasino1345.com
wallpapertop.net
casino-natali.com
iprofit-internet.com
denochemexicana.com
eventhalfkg.com
medcon-taiwan.com
life-himawari.com
myriamshomes.com
nightmarevue.com
healthandfitnesslives.com
androidnews-jp.com
allstarsru.com
bestofthebuckeyestate.com
bestofthefirststate.com
bestwireless7.com
britsmile.com
declarationintermittent.com
findhereall.com
jingyou888.com
lsm99deal.com
lsm99galaxy.com
moozatech.com
nuagh.com
patliyo.com
philomenamagikz.net
rckouba.net
saturnunipessoallda.com
tallahasseefrolics.com
thematurehardcore.net
totalenvironment-inthatquietearth.com
velislavakaymakanova.com
vermontenergetic.com
kakakpintar.com
jerusalemdispatch.com
begorgeouslady.com
1800birks4u.com
2wheelstogo.com
6strip4you.com
bigdata-world.net
emailandco.net
gacapal.com
jharpost.com
krishnaastro.com
lsm99credit.com
mascalzonicampani.com
sitemapxml.org
thecityslums.net
topagh.com
flairnetwebdesign.com
rajasthancarservices.com
bangkaeair.com
beneventocoupon.com
noternet.org
oqtive.com
smilebrightrx.com
decollage-etiquette.com
1millionbestdownloads.com
7658.info
bidbass.com
devlopworldtech.com
digitalmarketingrajkot.com
fluginfo.net
naqlafshk.com
passion-decouverte.com
playsirius.com
spacceleratorintl.com
stikyballs.com
top10way.com
yokidsyogurt.com
zszyhl.com
16firthcrescent.com
abogadolaboralistamd.com
apk2wap.com
aromacremeria.com
banparacard.com
bosmanraws.com
businessproviderblog.com
caltonosa.com
calvaryrevivalchurch.org
chastenedsoulwithabrokenheart.com
cheminotsgardcevennes.com
cooksspot.com
cqxzpt.com
deesywig.com
deltacartoonmaps.com
despixelsetdeshommes.com
duocoracaobrasileiro.com
fareshopbd.com
goodpainspills.com
hemendekor.com
kobisitecdn.com
makaigoods.com
mgs1454.com
piccadillyresidences.com
radiolaondafresca.com
rubendorf.com
searchengineimprov.com
sellmyhrvahome.com
shugahouseessentials.com
sonihullquad.com
subtractkilos.com
valeriekelmansky.com
vipasdigitalmarketing.com
voolivrerj.com
worldhealthstory.com
zeelonggroup.com
1015southrockhill.com
10x10b.com
111-online-casinos.com
191cb.com
3665arpentunitd.com
aitesonics.com
bag-shokunin.com
brightotech.com
communication-digitale-services.com
covoakland.org
dariaprimapack.com
freefortniteaccountss.com
gatebizglobal.com
global1entertainmentnews.com
greatytene.com
hiroshiwakita.com
iktodaypk.com
jahatsakong.com
meadowbrookgolfgroup.com
newsbharati.net
platinumstudiosdesign.com
slotxogamesplay.com
strikestaruk.com
techguroh.com
trucosdefortnite.com
ufabetrune.com
weddedtowhitmore.com
12940brycecanyonunitb.com
1311dietrichoaks.com
2monarchtraceunit303.com
601legendhill.com
850elaine.com
adieusolasomade.com
andora-ke.com
bestslotxogames.com
cannagomcallen.com
endlesslyhot.com
iestpjva.com
ouqprint.com
pwmaplefest.com
qtylmr.com
rb88betting.com
buscadogues.com
1007macfm.com
born-wild.com
growthinvests.com
promocode-casino.com
proyectogalgoargentina.com
wbthompson-art.com
whitemountainwheels.com
7thavehvl.com
developmethis.com
funkydogbowties.com
travelodgegrandjunction.com
gao-town.com
globalmarketsuite.com
blogshippo.com
hdbka.com
proboards67.com
outletonline-michaelkors.com
kalkis-research.com
thuthuatit.net
buckcash.com
hollistercanada.com
docterror.com
asadart.com
vmayke.org
erwincomputers.com
dirimart.org
okkii.com
loteriasdecehegin.com
mountanalog.com
healingtaobritain.com
ttxmonitor.com
nwordpress.com
11bolabonanza.com