_
_
_
_

¡°El sistema falla donde menos te lo esperas¡±. As¨ª evaluaron GPT-4 estos dos espa?oles por encargo de OpenAI

Jos¨¦ Hern¨¢ndez-Orallo y C¨¨sar Ferri, ambos investigadores de inteligencia artificial en la UPV, pertenecieron al grupo de apenas 40 personas seleccionadas para evaluar la actual versi¨®n de pago de ChatGPT

C¨¦sar Ferri
A la izquierda, C¨¦sar Ferri; a la derecha, Jos¨¦ Hern¨¢ndez-Orallo.M¨°nica Torres

En el verano de 2022, los que buceaban en las aguas m¨¢s profundas de la inteligencia artificial ¡ªinvestigadores, empleados del sector, directores de IA en empresas¡ª sab¨ªan bien que OpenAI preparaba el lanzamiento de su siguiente GPT (su modelo de lenguaje o LLM). Pero no se conoc¨ªan detalles. Ni cu¨¢ndo ser¨ªa, ni qui¨¦n tendr¨ªa acceso, ni qu¨¦ capacidades nuevas demostrar¨ªa respecto a la versi¨®n anterior, GPT-3, de uso restringido. As¨ª estaban Jos¨¦ Hern¨¢ndez-Orallo y C¨¨sar Ferri cuando en septiembre, Lama Ahmad, investigadora de pol¨ªticas en OpenAI, les propuso formar parte del equipo externo que evaluar¨ªa GPT-4.

Hern¨¢ndez-Orallo y Ferri, ambos catedr¨¢ticos del departamento de Sistemas Inform¨¢ticos y Computaci¨®n de la Universitat Polit¨¨cnica de Val¨¨ncia (UPV), pertenecen al mismo grupo de investigaci¨®n y tienen una amplia experiencia en evaluaci¨®n de sistemas de inteligencia artificial. Quiz¨¢ por eso se cuentan entre las poco m¨¢s de 40 personas que OpenAI seleccion¨® en todo el mundo para probar su nuevo modelo de lenguaje. El objetivo era encontrar fallas en el sistema durante los seis meses anteriores al lanzamiento, en marzo de 2023.

¡°Ya desde GPT-3 nos han dado acceso siempre a sus sistemas de manera gratuita, a veces antes del lanzamiento, para hacer investigaci¨®n¡±, indica Hern¨¢ndez-Orallo, que colabora con OpenAI desde hace cuatro a?os y destaca la buena comunicaci¨®n entre la empresa y los investigadores que quieren analizar sus sistemas. El a?o pasado, ese verano en que se rumoreaba la llegada del pr¨®ximo GPT, el acercamiento se estrech¨®. Los investigadores de la UPV organizaron un taller dentro de la Conferencia conjunta internacional sobre inteligencia artificial, uno de los eventos de inteligencia artificial m¨¢s prestigiosos del a?o, y all¨ª conocieron a m¨¢s gente de OpenAI. Recibieron su llamada en septiembre.

¡°Nos dieron bastante libertad¡±, comenta Ferri. ¡°Solo ten¨ªamos pautas a grandes rasgos de lo que deb¨ªamos buscar, como detectar contestaciones que incluyera texto peligroso, sexista o racista. El fin era evitar que la herramienta generara texto que pudiera causar alg¨²n problema. Fuimos jugando y probando diferentes prompts (instrucciones) que pudieran provocar ese tipo de respuestas¡±. Los investigadores formaron un equipo, compuesto por ellos mismos y tres estudiantes: Yael Moros, Lexin Zhou, Wout Schellaert.

Jos¨¦ Hern¨¢ndez-Orallo, experto en inteligencia artificial en la Universidad Polit¨¦cnica de Valencia.
Jos¨¦ Hern¨¢ndez-Orallo, experto en inteligencia artificial en la Universidad Polit¨¦cnica de Valencia.M¨°nica Torres

¡°Ellos se ve¨ªan que lo iban a lanzar e iban a tener millones de usuarios, as¨ª que cuantas m¨¢s cosas raras probaras m¨¢s puedes cubrir el espacio de las locuras que pueda hacer la gente¡±, explica Hern¨¢ndez-Orallo. Se trataba de ponerle la zancadilla a GPT-4 para ver si tropezaba. Desde los ordenadores de su laboratorio, en la UPV, introduc¨ªan textos en los que de alguna forma invitaban al sistema a tener una contestaci¨®n con un sesgo peligroso.

En busca de fallos

Ferri confiesa que le resultaba emocionante tener acceso en primicia a la herramienta. GPT-3 (lanzado de forma restringida en 2020) ya funcionaba muy bien, as¨ª que los investigadores sab¨ªan que ten¨ªan entre manos lo m¨¢s avanzado en inteligencia artificial generativa.

Hab¨ªa mucho que probar y cada uno experimentaba en el campo que m¨¢s le interesaba. Hern¨¢ndez-Orallo explor¨® la fiabilidad: ¡°El sistema falla donde t¨² menos te lo esperas. Y esto es bastante habitual con los modelos de lenguaje. Te resuelve una ecuaci¨®n diferencial, pero luego no te suma bien una suma de cinco d¨ªgitos. Una persona de la calle se conf¨ªa cuando hace bien una ecuaci¨®n diferencial de primero de carrera. Pero en el ¨²ltimo paso del problema tiene que hacer una suma de dos vectores y falla¡±. El catedr¨¢tico de la UPV describe esta problem¨¢tica como un desajuste entre las expectativas del usuario y la capacidad de la IA.

No todos los expertos seleccionados por OpenAI para evaluar GPT-4 ten¨ªan un bagaje computacional. Algunos ten¨ªan formaci¨®n en leyes, en medicina, en derechos humanos o en defensa contra armas qu¨ªmicas. El objetivo era pulir el sistema. Uno de los evaluadores, seg¨²n recoge el informe t¨¦cnico que public¨® OpenAI sobre GPT-4, lograba mediante una instrucci¨®n que el sistema redactara paso por paso c¨®mo sintetizar un compuesto qu¨ªmico peligroso de forma casera. Este tipo de respuestas se invalidaban para evitar que persistieran en la versi¨®n abierta al p¨²blico.

Y en medio de este proceso de revisi¨®n en la sombra se desat¨® la tormenta. El 30 de noviembre de 2022, OpenAI lanz¨® ChatGPT. ¡°Para nosotros fue una sorpresa. Nadie nos hab¨ªa dicho que hab¨ªa un proyecto en paralelo¡±, cuenta Hern¨¢ndez-Orallo. ¡°De la noche a la ma?ana aparece ChatGPT, que ni siquiera ten¨ªamos claro si era la versi¨®n que nosotros est¨¢bamos evaluando o no¡±. Al cabo de unos d¨ªas se aclar¨® que el sistema lanzado en abierto se basaba en un GPT-3.5, una versi¨®n previa a la que ellos evaluaban.

Los investigadores siguieron con su trabajo. Quedaban a¨²n unos meses para el lanzamiento de GPT-4 y segu¨ªan enrocados en su asombro. ¡°Ve¨ªamos que era capaz de resolver una sopa de letras, donde tienes que buscar patrones de palabras que aparecen en vertical o diagonal. Era algo inesperado. Nadie esperaba que funcionara as¨ª¡±, comenta Ferri.

C¨¦sar Ferri
C¨¦sar Ferri, catedr¨¢tico en el departamento de Sistemas Inform¨¢ticos y Computaci¨®n de la Universidad Polit¨¦cnica de Valencia. M¨°nica Torres

Ahora ChatGPT permite introducir gr¨¢ficos en una consulta, pero en aquel momento los investigadores no pod¨ªan hacerlo. Para probar sus capacidades, le pasaban coordenadas espaciales que unidas entre s¨ª formaban una figura. ¡°Le dec¨ªamos ¡®te voy a pasar las coordenadas de unos trazos¡¯. Le explicabas que el primer trazo iba de (0,0) a (5,5) y as¨ª¡±, indica Ferri. ¡°Esto si t¨² se lo das a un humano, le cuesta, lo tenemos que pintar. Y GPT-4 era capaz de adivinar las figuras, como cuadrados, rect¨¢ngulos y dibujos m¨¢s elaborados, como un coche o un avi¨®n¡±. Era una capacidad de abstracci¨®n que no se hab¨ªa visto antes en inteligencia artificial. El investigador lo resume as¨ª: ¡°Hab¨ªamos pasado la barrera del texto¡±.

¡°Con GPT-4 s¨ª se pueden romper cosas¡±

ChatGPT, al principio con el modelo GPT-3.5 y ahora tambi¨¦n con GPT-4, fue el primer sistema de generaci¨®n de texto avanzado en llegar a las masas. Y los investigadores eran conscientes de que esto significaba un salto cualitativo salpicado de incertidumbres. ¡°Es una irresponsabilidad desde el punto de vista cognitivo¡±, afirma Hern¨¢ndez-Orallo sobre el lanzamiento al p¨²blico masivo de la herramienta. ¡°No tanto porque el sistema se vaya a ir de madre o vaya a soltar improperios¡±, a?ade. Lo que le preocupa es que ¡°estos sistemas puedan llevar a atrofias cognitivas o a gente que use este sistema como su terapeuta o su compa?ero de vida. Este tipo de cosas est¨¢n pasando a un nivel mucho menor de lo que pod¨ªa haber pasado, pero est¨¢n pasando¡±.

Esta inquietud entronca con el cataclismo que hubo en OpenAI, cuando el consejo de administraci¨®n despidi¨® al CEO Sam Altman, solo para devolverlo a su puesto tras unos d¨ªas de truculenta inestabilidad. Por lo que ha trascendido, en el fondo de esta pugna estaba la pelea entre priorizar o no la seguridad de la inteligencia artificial frente a su despliegue comercial.

Los investigadores encuentran sentido a este debate: ¡°Hasta ahora no hab¨ªamos llegado a un nivel tan avanzado en IA, as¨ª que tampoco se pod¨ªan romper muchas cosas. Con GPT-4 s¨ª que vemos que se pueden romper cosas, con lo cual igual necesitamos tom¨¢rnoslo con calma¡±, apunta Ferri, en referencia al deseo expresado por parte de la comunidad investigadora de frenar la carrera por la IA con el fin de ganar margen para evaluar su impacto social.

Puedes seguir a EL PA?S Tecnolog¨ªa en Facebook y X o apuntarte aqu¨ª para recibir nuestra newsletter semanal.

Tu suscripci¨®n se est¨¢ usando en otro dispositivo

?Quieres a?adir otro usuario a tu suscripci¨®n?

Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.

?Por qu¨¦ est¨¢s viendo esto?

Flecha

Tu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.

Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.

En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.

Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.

M¨¢s informaci¨®n

Archivado En

Recomendaciones EL PA?S
Recomendaciones EL PA?S
Recomendaciones EL PA?S
_
_
seductrice.net
universo-virtual.com
buytrendz.net
thisforall.net
benchpressgains.com
qthzb.com
mindhunter9.com
dwjqp1.com
secure-signup.net
ahaayy.com
tressesindia.com
puresybian.com
krpano-chs.com
cre8workshop.com
hdkino.org
peixun021.com
qz786.com
utahperformingartscenter.org
worldqrmconference.com
shangyuwh.com
eejssdfsdfdfjsd.com
playminecraftfreeonline.com
trekvietnamtour.com
your-business-articles.com
essaywritingservice10.com
hindusamaaj.com
joggingvideo.com
wandercoups.com
wormblaster.net
tongchengchuyange0004.com
internetknowing.com
breachurch.com
peachesnginburlesque.com
dataarchitectoo.com
clientfunnelformula.com
30pps.com
cherylroll.com
ks2252.com
prowp.net
webmanicura.com
sofietsshotel.com
facetorch.com
nylawyerreview.com
apapromotions.com
shareparelli.com
goeaglepointe.com
thegreenmanpubphuket.com
karotorossian.com
publicsensor.com
taiwandefence.com
epcsur.com
southstills.com
tvtv98.com
thewellington-hotel.com
bccaipiao.com
colectoresindustrialesgs.com
shenanddcg.com
capriartfilmfestival.com
replicabreitlingsale.com
thaiamarinnewtoncorner.com
gkmcww.com
mbnkbj.com
andrewbrennandesign.com
cod54.com
luobinzhang.com
faithfirst.net
zjyc28.com
tongchengjinyeyouyue0004.com
nhuan6.com
kftz5k.com
oldgardensflowers.com
lightupthefloor.com
bahamamamas-stjohns.com
ly2818.com
905onthebay.com
fonemenu.com
notanothermovie.com
ukrainehighclassescort.com
meincmagazine.com
av-5858.com
yallerdawg.com
donkeythemovie.com
corporatehospitalitygroup.com
boboyy88.com
miteinander-lernen.com
dannayconsulting.com
officialtomsshoesoutletstore.com
forsale-amoxil-amoxicillin.net
generictadalafil-canada.net
guitarlessonseastlondon.com
lesliesrestaurants.com
mattyno9.com
nri-homeloans.com
rtgvisas-qatar.com
salbutamolventolinonline.net
sportsinjuries.info
wedsna.com
rgkntk.com
bkkmarketplace.com
zxqcwx.com
breakupprogram.com
boxcardc.com
unblockyoutubeindonesia.com
fabulousbookmark.com
beat-the.com
guatemala-sailfishing-vacations-charters.com
magie-marketing.com
kingstonliteracy.com
guitaraffinity.com
eurelookinggoodapparel.com
howtolosecheekfat.net
marioncma.org
oliviadavismusic.com
shantelcampbellrealestate.com
shopleborn13.com
topindiafree.com
v-visitors.net
djjky.com
053hh.com
originbluei.com
baucishotel.com
33kkn.com
intrinsiqresearch.com
mariaescort-kiev.com
mymaguk.com
sponsored4u.com
crimsonclass.com
bataillenavale.com
searchtile.com
ze-stribrnych-struh.com
zenithalhype.com
modalpkv.com
bouisset-lafforgue.com
useupload.com
37r.net
autoankauf-muenster.com
bantinbongda.net
bilgius.com
brabustermagazine.com
indigrow.org
miicrosofts.net
mysmiletravel.com
selinasims.com
spellcubesapp.com
usa-faction.com
hypoallergenicdogsnames.com
dailyupdatez.com
foodphotographyreviews.com
cricutcom-setup.com
chprowebdesign.com
katyrealty-kanepa.com
tasramar.com
bilgipinari.org
four-am.com
indiarepublicday.com
inquick-enbooks.com
iracmpi.com
kakaschoenen.com
lsm99flash.com
nana1255.com
ngen-niagara.com
technwzs.com
virtualonlinecasino1345.com
wallpapertop.net
casino-natali.com
iprofit-internet.com
denochemexicana.com
eventhalfkg.com
medcon-taiwan.com
life-himawari.com
myriamshomes.com
nightmarevue.com
healthandfitnesslives.com
androidnews-jp.com
allstarsru.com
bestofthebuckeyestate.com
bestofthefirststate.com
bestwireless7.com
britsmile.com
declarationintermittent.com
findhereall.com
jingyou888.com
lsm99deal.com
lsm99galaxy.com
moozatech.com
nuagh.com
patliyo.com
philomenamagikz.net
rckouba.net
saturnunipessoallda.com
tallahasseefrolics.com
thematurehardcore.net
totalenvironment-inthatquietearth.com
velislavakaymakanova.com
vermontenergetic.com
kakakpintar.com
begorgeouslady.com
1800birks4u.com
2wheelstogo.com
6strip4you.com
bigdata-world.net
emailandco.net
gacapal.com
jharpost.com
krishnaastro.com
lsm99credit.com
mascalzonicampani.com
sitemapxml.org
thecityslums.net
topagh.com
flairnetwebdesign.com
rajasthancarservices.com
bangkaeair.com
beneventocoupon.com
noternet.org
oqtive.com
smilebrightrx.com
decollage-etiquette.com
1millionbestdownloads.com
7658.info
bidbass.com
devlopworldtech.com
digitalmarketingrajkot.com
fluginfo.net
naqlafshk.com
passion-decouverte.com
playsirius.com
spacceleratorintl.com
stikyballs.com
top10way.com
yokidsyogurt.com
zszyhl.com
16firthcrescent.com
abogadolaboralistamd.com
apk2wap.com
aromacremeria.com
banparacard.com
bosmanraws.com
businessproviderblog.com
caltonosa.com
calvaryrevivalchurch.org
chastenedsoulwithabrokenheart.com
cheminotsgardcevennes.com
cooksspot.com
cqxzpt.com
deesywig.com
deltacartoonmaps.com
despixelsetdeshommes.com
duocoracaobrasileiro.com
fareshopbd.com
goodpainspills.com
hemendekor.com
kobisitecdn.com
makaigoods.com
mgs1454.com
piccadillyresidences.com
radiolaondafresca.com
rubendorf.com
searchengineimprov.com
sellmyhrvahome.com
shugahouseessentials.com
sonihullquad.com
subtractkilos.com
valeriekelmansky.com
vipasdigitalmarketing.com
voolivrerj.com
zeelonggroup.com
1015southrockhill.com
10x10b.com
111-online-casinos.com
191cb.com
3665arpentunitd.com
aitesonics.com
bag-shokunin.com
brightotech.com
communication-digitale-services.com
covoakland.org
dariaprimapack.com
freefortniteaccountss.com
gatebizglobal.com
global1entertainmentnews.com
greatytene.com
hiroshiwakita.com
iktodaypk.com
jahatsakong.com
meadowbrookgolfgroup.com
newsbharati.net
platinumstudiosdesign.com
slotxogamesplay.com
strikestaruk.com
trucosdefortnite.com
ufabetrune.com
weddedtowhitmore.com
12940brycecanyonunitb.com
1311dietrichoaks.com
2monarchtraceunit303.com
601legendhill.com
850elaine.com
adieusolasomade.com
andora-ke.com
bestslotxogames.com
cannagomcallen.com
endlesslyhot.com
iestpjva.com
ouqprint.com
pwmaplefest.com
qtylmr.com
rb88betting.com
buscadogues.com
1007macfm.com
born-wild.com
growthinvests.com
promocode-casino.com
proyectogalgoargentina.com
wbthompson-art.com
whitemountainwheels.com
7thavehvl.com
developmethis.com
funkydogbowties.com
travelodgegrandjunction.com
gao-town.com
globalmarketsuite.com
blogshippo.com
hdbka.com
proboards67.com
outletonline-michaelkors.com
kalkis-research.com
thuthuatit.net
buckcash.com
hollistercanada.com
docterror.com
asadart.com
vmayke.org
erwincomputers.com
dirimart.org
okkii.com
loteriasdecehegin.com
mountanalog.com
healingtaobritain.com
ttxmonitor.com
nwordpress.com
11bolabonanza.com