_
_
_
_

Las m¨¢quinas entrenadas con datos artificiales llevan al colapso de la IA: ¡°Pierden la percepci¨®n de la realidad¡±

La p¨¦rdida de calidad del contenido y la perpetuaci¨®n de los sesgos son algunas consecuencias de este bucle en los modelos de inteligencia artificial

Alimentar a la inteligencia artificial con datos de IA
Una persona trabaja con una imagen ilustrativa generada por inteligencia artificial en la pantalla, que muestra c¨®digo de varios lenguajes de programaci¨®n y un diagrama de red neuronal.picture alliance (dpa/picture alliance via Getty I)
Natalia Ponjoan

Si se le pide a un modelo de inteligencia artificial (IA) que genere im¨¢genes de perros al azar, la m¨¢quina va a recrear las im¨¢genes de un golden retriever como la raza de perro m¨¢s popular, pero tambi¨¦n algunos d¨¢lmatas o bulldogs franceses, aunque en menor cantidad por ser razas m¨¢s raras. Pero si otros modelos de IA se entrenaran con los datos producidos por esa m¨¢quina, con el golden retriever sobrerrepresentado, poco a poco se olvidar¨¢n de las razas menos comunes y solo mostrar¨¢n esa raza. Finalmente, devolver¨¢n ¨²nicamente manchas marrones que se asemejan a esos perros. Una investigaci¨®n demuestra que despu¨¦s de entrenar una y otra vez a un modelo de IA con contenido generado por la misma m¨¢quina, el modelo colapsa, dejando as¨ª de funcionar, dando malas respuestas y proporcionando informaci¨®n incorrecta. ¡°Empiezan a producir ejemplos que nunca ser¨ªan creados por el modelo original, es decir, empiezan a malinterpretar la realidad bas¨¢ndose en errores introducidos por sus predecesores¡±, explica el estudio que alerta de c¨®mo las m¨¢quinas que se entrenan con informaci¨®n sint¨¦tica ¡°pierden la percepci¨®n de la realidad¡±.

¡°Empieza a perder informaci¨®n porque no est¨¢ claro si los datos recogidos son suficientes para cubrir todos los casos posibles. Los modelos est¨¢n sesgados e introducen sus propios errores, y los modelos del futuro pueden percibir err¨®neamente la realidad, ya que se entrenar¨¢n con datos sesgados procedentes de otros modelos¡±, explica Ilia Shumailov, coautor del estudio publicado hoy en la revista Nature, punta de lanza de la mejor ciencia, e investigador de la Universidad de Oxford, que actualmente trabaja para Google DeepMind. Los datos se ¡°envenenan¡±, seg¨²n expresa el estudio.

Los autores del estudio presentan unos modelos matem¨¢ticos que ilustran la idea del colapso: demuestran que una IA puede pasar por alto algunos datos en su entrenamiento (por ejemplo, l¨ªneas de texto menos comunes) y solo entrenarse con una parte de ellos. Por ejemplo, se hizo una prueba con un texto sobre arquitectura medieval como entrada original y en el noveno entrenamiento termin¨® dando una lista de liebres. ¡°Los modelos aprenden unos de otros. Cu¨¢nto m¨¢s aprenden, m¨¢s degradan su rendimiento y empiezan a generar texto repetitivo que es independiente de la petici¨®n de entrada¡±, a?ade Shumailov.

Hoy en d¨ªa es una pr¨¢ctica habitual que los modelos se entrenen con datos sint¨¦ticos, aquellos que no han sido creados por humanos, sino que imitan datos del mundo real. As¨ª lo se?ala el ¨²ltimo informe de ChatGPT-4 de OpenAI. En principio, ser¨ªa casi imposible distinguir si los datos han sido generados por m¨¢quinas o humanos, pero si no se toman medidas para controlar el colapso, las consecuencias son ¡°la degradaci¨®n de la calidad del contenido, la contaminaci¨®n de datos, y la perpetuaci¨®n de los sesgos¡±, describe Luis Herrera, arquitecto de soluciones en Databricks Espa?a.

?Por qu¨¦ las empresas tecnol¨®gicas que est¨¢n detr¨¢s de los modelos de lenguaje permiten estas pr¨¢cticas? ¡°Las IA son entrenadas con enormes cantidades de datos presentes en internet, producidos por personas que tienen derechos legales de autor¨ªa de su material. Para evitar demandas judiciales o para ahorrar costes, las empresas tecnol¨®gicas utilizan datos generados por sus propias IA para seguir entrenando sus m¨¢quinas¡±, explica V¨ªctor Etxebarria, catedr¨¢tico de la Universidad del Pa¨ªs Vasco, en declaraciones al portal especializado SMC Espa?a. Sin embargo, a?ade: ¡°Este procedimiento cada vez m¨¢s generalizado hace que las IA no sirvan para ninguna funci¨®n realmente fiable. Transforma las IA en herramientas no solo in¨²tiles para ayudarnos a solucionar nuestros problemas, sino que puedes ser nocivas, si basamos nuestras decisiones en informaci¨®n incorrecta¡±.

El contenido creado puede ser utilizado para entrenar a otros modelos o incluso para entrenarse a ellos mismos. Incluso el bucle de degradaci¨®n puede empezar de forma involuntaria, cuando las m¨¢quinas se entrenan con contenidos de internet, pero que han sido vertidos a su vez por otras m¨¢quinas. Lorena Jaume-Palas¨ª, experta en ¨¦tica algor¨ªtmica y asesora del Parlamento Europeo, alerta sobre peligro del origen de los datos sint¨¦ticos: ¡°El buscador de Google es uno de los sitios en los que la calidad ha decrecido. Hay una gran variedad en la procedencia de este tipo de datos y la calidad en ning¨²n momento puede ser buena. Son trillones de datos humanamente imposibles de corregirlos todos¡±. Y hace hincapi¨¦ en el ¡°colapso ecol¨®gico¡± que provoca estos modelos: ¡°Los centros de datos se est¨¢n llevando toda el agua. Va a llegar un momento en que vamos a tener que decidir a qui¨¦n le damos agua y a qui¨¦n no¡±.

Entrenamiento de un modelo de inteligencia artificial con im¨¢genes generadas con sus propios resultados, seg¨²n el News&views de Nature de la autora Emily Wenger, profesora de Ingenier¨ªa El¨¦ctrica e Inform¨¢tica de la Universidad de Duke, en Carolina del Norte.
Entrenamiento de un modelo de inteligencia artificial con im¨¢genes generadas con sus propios resultados, seg¨²n el News&views de Nature de la autora Emily Wenger, profesora de Ingenier¨ªa El¨¦ctrica e Inform¨¢tica de la Universidad de Duke, en Carolina del Norte.Nature

Pablo Haya Coll, investigador de la Universidad Aut¨®noma de Madrid, destaca una limitaci¨®n de estos sistemas: ¡°Esta t¨¦cnica puede llevar a corromper el LLM [un gran modelo de lenguaje, como ChatGPT, por sus siglas inglesas]. Es un aviso sobre la calidad de los datos utilizados en la construcci¨®n de estos LLM. A medida que se adoptan m¨¢s estos LLM, m¨¢s datos sint¨¦ticos terminan en internet, lo que podr¨ªa afectar hipot¨¦ticamente a los entrenamientos de versiones futuras¡±.

Las conclusiones del estudio plantean un escenario donde solo se utilizan datos generados por la IA. En un contexto real, es probable que siempre haya una parte de los datos generados por humanos: como m¨ªnimo, los que hay disponibles ahora. Pero todav¨ªa no est¨¢ claro c¨®mo se pueden diferenciar esos datos. Shumailov, autor principal del estudio, sugiere que se haga con ¡°el mantenimiento de listas y las marcas de agua¡±.

Para este investigador y sus colegas, entrenar un modelo con datos generados sint¨¦ticamente es posible, pero el filtrado debe tomarse muy en serio. Toju Duke, exdirectora de IA responsable de Google, explicaba a EL PA?S en octubre del a?o pasado que se pueden entrenar a los modelos con datos generados por IA, siempre y cuando entre la regulaci¨®n en juego: ¡°Tenemos que ser capaces de comprobar los hechos y las fuentes. Tenemos que poder revisar estas cosas antes de lanzarlas. No podemos simplemente dejar que salgan, eso es una locura¡±.

Puedes seguir a EL PA?S Tecnolog¨ªa en Facebook y X o apuntarte aqu¨ª para recibir nuestra newsletter sema c

Tu suscripci¨®n se est¨¢ usando en otro dispositivo

?Quieres a?adir otro usuario a tu suscripci¨®n?

Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.

?Por qu¨¦ est¨¢s viendo esto?

Flecha

Tu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.

Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.

En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.

Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.

Rellena tu nombre y apellido para comentarcompletar datos

M¨¢s informaci¨®n

Archivado En

Recomendaciones EL PA?S
Recomendaciones EL PA?S
Recomendaciones EL PA?S
_
_
seductrice.net
universo-virtual.com
buytrendz.net
thisforall.net
benchpressgains.com
qthzb.com
mindhunter9.com
dwjqp1.com
secure-signup.net
ahaayy.com
tressesindia.com
puresybian.com
krpano-chs.com
cre8workshop.com
hdkino.org
peixun021.com
qz786.com
utahperformingartscenter.org
worldqrmconference.com
shangyuwh.com
eejssdfsdfdfjsd.com
playminecraftfreeonline.com
trekvietnamtour.com
your-business-articles.com
essaywritingservice10.com
hindusamaaj.com
joggingvideo.com
wandercoups.com
wormblaster.net
tongchengchuyange0004.com
internetknowing.com
breachurch.com
peachesnginburlesque.com
dataarchitectoo.com
clientfunnelformula.com
30pps.com
cherylroll.com
ks2252.com
prowp.net
webmanicura.com
sofietsshotel.com
facetorch.com
nylawyerreview.com
apapromotions.com
shareparelli.com
goeaglepointe.com
thegreenmanpubphuket.com
karotorossian.com
publicsensor.com
taiwandefence.com
epcsur.com
mfhoudan.com
southstills.com
tvtv98.com
thewellington-hotel.com
bccaipiao.com
colectoresindustrialesgs.com
shenanddcg.com
capriartfilmfestival.com
replicabreitlingsale.com
thaiamarinnewtoncorner.com
gkmcww.com
mbnkbj.com
andrewbrennandesign.com
cod54.com
luobinzhang.com
faithfirst.net
zjyc28.com
tongchengjinyeyouyue0004.com
nhuan6.com
kftz5k.com
oldgardensflowers.com
lightupthefloor.com
bahamamamas-stjohns.com
ly2818.com
905onthebay.com
fonemenu.com
notanothermovie.com
ukrainehighclassescort.com
meincmagazine.com
av-5858.com
yallerdawg.com
donkeythemovie.com
corporatehospitalitygroup.com
boboyy88.com
miteinander-lernen.com
dannayconsulting.com
officialtomsshoesoutletstore.com
forsale-amoxil-amoxicillin.net
generictadalafil-canada.net
guitarlessonseastlondon.com
lesliesrestaurants.com
mattyno9.com
nri-homeloans.com
rtgvisas-qatar.com
salbutamolventolinonline.net
sportsinjuries.info
wedsna.com
rgkntk.com
bkkmarketplace.com
zxqcwx.com
breakupprogram.com
boxcardc.com
unblockyoutubeindonesia.com
fabulousbookmark.com
beat-the.com
guatemala-sailfishing-vacations-charters.com
magie-marketing.com
kingstonliteracy.com
guitaraffinity.com
eurelookinggoodapparel.com
howtolosecheekfat.net
marioncma.org
oliviadavismusic.com
shantelcampbellrealestate.com
shopleborn13.com
topindiafree.com
v-visitors.net
djjky.com
053hh.com
originbluei.com
baucishotel.com
33kkn.com
intrinsiqresearch.com
mariaescort-kiev.com
mymaguk.com
sponsored4u.com
crimsonclass.com
bataillenavale.com
searchtile.com
ze-stribrnych-struh.com
zenithalhype.com
modalpkv.com
bouisset-lafforgue.com
useupload.com
37r.net
autoankauf-muenster.com
bantinbongda.net
bilgius.com
brabustermagazine.com
indigrow.org
miicrosofts.net
mysmiletravel.com
selinasims.com
spellcubesapp.com
usa-faction.com
hypoallergenicdogsnames.com
dailyupdatez.com
foodphotographyreviews.com
cricutcom-setup.com
chprowebdesign.com
katyrealty-kanepa.com
tasramar.com
bilgipinari.org
four-am.com
indiarepublicday.com
inquick-enbooks.com
iracmpi.com
kakaschoenen.com
lsm99flash.com
nana1255.com
ngen-niagara.com
technwzs.com
virtualonlinecasino1345.com
wallpapertop.net
casino-natali.com
iprofit-internet.com
denochemexicana.com
eventhalfkg.com
medcon-taiwan.com
life-himawari.com
myriamshomes.com
nightmarevue.com
healthandfitnesslives.com
androidnews-jp.com
allstarsru.com
bestofthebuckeyestate.com
bestofthefirststate.com
bestwireless7.com
britsmile.com
declarationintermittent.com
findhereall.com
jingyou888.com
lsm99deal.com
lsm99galaxy.com
moozatech.com
nuagh.com
patliyo.com
philomenamagikz.net
rckouba.net
saturnunipessoallda.com
tallahasseefrolics.com
thematurehardcore.net
totalenvironment-inthatquietearth.com
velislavakaymakanova.com
vermontenergetic.com
kakakpintar.com
jerusalemdispatch.com
begorgeouslady.com
1800birks4u.com
2wheelstogo.com
6strip4you.com
bigdata-world.net
emailandco.net
gacapal.com
jharpost.com
krishnaastro.com
lsm99credit.com
mascalzonicampani.com
sitemapxml.org
thecityslums.net
topagh.com
flairnetwebdesign.com
rajasthancarservices.com
bangkaeair.com
beneventocoupon.com
noternet.org
oqtive.com
smilebrightrx.com
decollage-etiquette.com
1millionbestdownloads.com
7658.info
bidbass.com
devlopworldtech.com
digitalmarketingrajkot.com
fluginfo.net
naqlafshk.com
passion-decouverte.com
playsirius.com
spacceleratorintl.com
stikyballs.com
top10way.com
yokidsyogurt.com
zszyhl.com
16firthcrescent.com
abogadolaboralistamd.com
apk2wap.com
aromacremeria.com
banparacard.com
bosmanraws.com
businessproviderblog.com
caltonosa.com
calvaryrevivalchurch.org
chastenedsoulwithabrokenheart.com
cheminotsgardcevennes.com
cooksspot.com
cqxzpt.com
deesywig.com
deltacartoonmaps.com
despixelsetdeshommes.com
duocoracaobrasileiro.com
fareshopbd.com
goodpainspills.com
hemendekor.com
kobisitecdn.com
makaigoods.com
mgs1454.com
piccadillyresidences.com
radiolaondafresca.com
rubendorf.com
searchengineimprov.com
sellmyhrvahome.com
shugahouseessentials.com
sonihullquad.com
subtractkilos.com
valeriekelmansky.com
vipasdigitalmarketing.com
voolivrerj.com
worldhealthstory.com
zeelonggroup.com
1015southrockhill.com
10x10b.com
111-online-casinos.com
191cb.com
3665arpentunitd.com
aitesonics.com
bag-shokunin.com
brightotech.com
communication-digitale-services.com
covoakland.org
dariaprimapack.com
freefortniteaccountss.com
gatebizglobal.com
global1entertainmentnews.com
greatytene.com
hiroshiwakita.com
iktodaypk.com
jahatsakong.com
meadowbrookgolfgroup.com
newsbharati.net
platinumstudiosdesign.com
slotxogamesplay.com
strikestaruk.com
techguroh.com
trucosdefortnite.com
ufabetrune.com
weddedtowhitmore.com
12940brycecanyonunitb.com
1311dietrichoaks.com
2monarchtraceunit303.com
601legendhill.com
850elaine.com
adieusolasomade.com
andora-ke.com
bestslotxogames.com
cannagomcallen.com
endlesslyhot.com
iestpjva.com
ouqprint.com
pwmaplefest.com
qtylmr.com
rb88betting.com
buscadogues.com
1007macfm.com
born-wild.com
growthinvests.com
promocode-casino.com
proyectogalgoargentina.com
wbthompson-art.com
whitemountainwheels.com
7thavehvl.com
developmethis.com
funkydogbowties.com
travelodgegrandjunction.com
gao-town.com
globalmarketsuite.com
blogshippo.com
hdbka.com
proboards67.com
outletonline-michaelkors.com
kalkis-research.com
thuthuatit.net
buckcash.com
hollistercanada.com
docterror.com
asadart.com
vmayke.org
erwincomputers.com
dirimart.org
okkii.com
loteriasdecehegin.com
mountanalog.com
healingtaobritain.com
ttxmonitor.com
nwordpress.com
11bolabonanza.com