��El sistema falla donde menos te lo esperas��. As�� evaluaron GPT-4 estos dos espa?oles por encargo de OpenAI

Jos�� Hern��ndez-Orallo y C��sar Ferri, ambos investigadores de inteligencia artificial en la UPV, pertenecieron al grupo de apenas 40 personas seleccionadas para evaluar la actual versi��n de pago de ChatGPT

A la izquierda, C��sar Ferri; a la derecha, Jos�� Hern��ndez-Orallo.M��nica Torres

12 dic 2023 - 05:20CET

En el verano de 2022, los que buceaban en las aguas m��s profundas de la inteligencia artificial ��investigadores, empleados del sector, directores de IA en empresas�� sab��an bien que OpenAI preparaba el lanzamiento de su siguiente GPT (su modelo de lenguaje o LLM). Pero no se conoc��an detalles. Ni cu��ndo ser��a, ni qui��n tendr��a acceso, ni qu�� capacidades nuevas demostrar��a respecto a la versi��n anterior, GPT-3, de uso restringido. As�� estaban Jos�� Hern��ndez-Orallo y C��sar Ferri cuando en septiembre, Lama Ahmad, investigadora de pol��ticas en OpenAI, les propuso formar parte del equipo externo que evaluar��a GPT-4.

Hern��ndez-Orallo y Ferri, ambos catedr��ticos del departamento de Sistemas Inform��ticos y Computaci��n de la Universitat Polit��cnica de Val��ncia (UPV), pertenecen al mismo grupo de investigaci��n y tienen una amplia experiencia en evaluaci��n de sistemas de inteligencia artificial. Quiz�� por eso se cuentan entre las poco m��s de 40 personas que OpenAI seleccion�� en todo el mundo para probar su nuevo modelo de lenguaje. El objetivo era encontrar fallas en el sistema durante los seis meses anteriores al lanzamiento, en marzo de 2023.

��Ya desde GPT-3 nos han dado acceso siempre a sus sistemas de manera gratuita, a veces antes del lanzamiento, para hacer investigaci��n��, indica Hern��ndez-Orallo, que colabora con OpenAI desde hace cuatro a?os y destaca la buena comunicaci��n entre la empresa y los investigadores que quieren analizar sus sistemas. El a?o pasado, ese verano en que se rumoreaba la llegada del pr��ximo GPT, el acercamiento se estrech��. Los investigadores de la UPV organizaron un taller dentro de la Conferencia conjunta internacional sobre inteligencia artificial, uno de los eventos de inteligencia artificial m��s prestigiosos del a?o, y all�� conocieron a m��s gente de OpenAI. Recibieron su llamada en septiembre.

��Nos dieron bastante libertad��, comenta Ferri. ��Solo ten��amos pautas a grandes rasgos de lo que deb��amos buscar, como detectar contestaciones que incluyera texto peligroso, sexista o racista. El fin era evitar que la herramienta generara texto que pudiera causar alg��n problema. Fuimos jugando y probando diferentes prompts (instrucciones) que pudieran provocar ese tipo de respuestas��. Los investigadores formaron un equipo, compuesto por ellos mismos y tres estudiantes: Yael Moros, Lexin Zhou, Wout Schellaert.

Jos�� Hern��ndez-Orallo, experto en inteligencia artificial en la Universidad Polit��cnica de Valencia.M��nica Torres

��Ellos se ve��an que lo iban a lanzar e iban a tener millones de usuarios, as�� que cuantas m��s cosas raras probaras m��s puedes cubrir el espacio de las locuras que pueda hacer la gente��, explica Hern��ndez-Orallo. Se trataba de ponerle la zancadilla a GPT-4 para ver si tropezaba. Desde los ordenadores de su laboratorio, en la UPV, introduc��an textos en los que de alguna forma invitaban al sistema a tener una contestaci��n con un sesgo peligroso.

En busca de fallos

Ferri confiesa que le resultaba emocionante tener acceso en primicia a la herramienta. GPT-3 (lanzado de forma restringida en 2020) ya funcionaba muy bien, as�� que los investigadores sab��an que ten��an entre manos lo m��s avanzado en inteligencia artificial generativa.

Hab��a mucho que probar y cada uno experimentaba en el campo que m��s le interesaba. Hern��ndez-Orallo explor�� la fiabilidad: ��El sistema falla donde t�� menos te lo esperas. Y esto es bastante habitual con los modelos de lenguaje. Te resuelve una ecuaci��n diferencial, pero luego no te suma bien una suma de cinco d��gitos. Una persona de la calle se conf��a cuando hace bien una ecuaci��n diferencial de primero de carrera. Pero en el ��ltimo paso del problema tiene que hacer una suma de dos vectores y falla��. El catedr��tico de la UPV describe esta problem��tica como un desajuste entre las expectativas del usuario y la capacidad de la IA.

No todos los expertos seleccionados por OpenAI para evaluar GPT-4 ten��an un bagaje computacional. Algunos ten��an formaci��n en leyes, en medicina, en derechos humanos o en defensa contra armas qu��micas. El objetivo era pulir el sistema. Uno de los evaluadores, seg��n recoge el informe t��cnico que public�� OpenAI sobre GPT-4, lograba mediante una instrucci��n que el sistema redactara paso por paso c��mo sintetizar un compuesto qu��mico peligroso de forma casera. Este tipo de respuestas se invalidaban para evitar que persistieran en la versi��n abierta al p��blico.

Y en medio de este proceso de revisi��n en la sombra se desat�� la tormenta. El 30 de noviembre de 2022, OpenAI lanz�� ChatGPT. ��Para nosotros fue una sorpresa. Nadie nos hab��a dicho que hab��a un proyecto en paralelo��, cuenta Hern��ndez-Orallo. ��De la noche a la ma?ana aparece ChatGPT, que ni siquiera ten��amos claro si era la versi��n que nosotros est��bamos evaluando o no��. Al cabo de unos d��as se aclar�� que el sistema lanzado en abierto se basaba en un GPT-3.5, una versi��n previa a la que ellos evaluaban.

Los investigadores siguieron con su trabajo. Quedaban a��n unos meses para el lanzamiento de GPT-4 y segu��an enrocados en su asombro. ��Ve��amos que era capaz de resolver una sopa de letras, donde tienes que buscar patrones de palabras que aparecen en vertical o diagonal. Era algo inesperado. Nadie esperaba que funcionara as��, comenta Ferri.

C��sar Ferri, catedr��tico en el departamento de Sistemas Inform��ticos y Computaci��n de la Universidad Polit��cnica de Valencia. M��nica Torres

Ahora ChatGPT permite introducir gr��ficos en una consulta, pero en aquel momento los investigadores no pod��an hacerlo. Para probar sus capacidades, le pasaban coordenadas espaciales que unidas entre s�� formaban una figura. ��Le dec��amos ��te voy a pasar las coordenadas de unos trazos��. Le explicabas que el primer trazo iba de (0,0) a (5,5) y as��, indica Ferri. ��Esto si t�� se lo das a un humano, le cuesta, lo tenemos que pintar. Y GPT-4 era capaz de adivinar las figuras, como cuadrados, rect��ngulos y dibujos m��s elaborados, como un coche o un avi��n��. Era una capacidad de abstracci��n que no se hab��a visto antes en inteligencia artificial. El investigador lo resume as��: ��Hab��amos pasado la barrera del texto��.

��Con GPT-4 s�� se pueden romper cosas��

ChatGPT, al principio con el modelo GPT-3.5 y ahora tambi��n con GPT-4, fue el primer sistema de generaci��n de texto avanzado en llegar a las masas. Y los investigadores eran conscientes de que esto significaba un salto cualitativo salpicado de incertidumbres. ��Es una irresponsabilidad desde el punto de vista cognitivo��, afirma Hern��ndez-Orallo sobre el lanzamiento al p��blico masivo de la herramienta. ��No tanto porque el sistema se vaya a ir de madre o vaya a soltar improperios��, a?ade. Lo que le preocupa es que ��estos sistemas puedan llevar a atrofias cognitivas o a gente que use este sistema como su terapeuta o su compa?ero de vida. Este tipo de cosas est��n pasando a un nivel mucho menor de lo que pod��a haber pasado, pero est��n pasando��.

Esta inquietud entronca con el cataclismo que hubo en OpenAI, cuando el consejo de administraci��n despidi�� al CEO Sam Altman, solo para devolverlo a su puesto tras unos d��as de truculenta inestabilidad. Por lo que ha trascendido, en el fondo de esta pugna estaba la pelea entre priorizar o no la seguridad de la inteligencia artificial frente a su despliegue comercial.

Los investigadores encuentran sentido a este debate: ��Hasta ahora no hab��amos llegado a un nivel tan avanzado en IA, as�� que tampoco se pod��an romper muchas cosas. Con GPT-4 s�� que vemos que se pueden romper cosas, con lo cual igual necesitamos tom��rnoslo con calma��, apunta Ferri, en referencia al deseo expresado por parte de la comunidad investigadora de frenar la carrera por la IA con el fin de ganar margen para evaluar su impacto social.

Puedes seguir a EL PA?S Tecnolog��a en Facebook y X o apuntarte aqu�� para recibir nuestra newsletter semanal.

Tu suscripci��n se est�� usando en otro dispositivo

?Quieres a?adir otro usuario a tu suscripci��n?

A?adir usuario Continuar leyendo aqu��

Si contin��as leyendo en este dispositivo, no se podr�� leer en el otro.

?Por qu�� est��s viendo esto?

Flecha

Tu suscripci��n se est�� usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.

Si quieres compartir tu cuenta, cambia tu suscripci��n a la modalidad Premium, as�� podr��s a?adir otro usuario. Cada uno acceder�� con su propia cuenta de email, lo que os permitir�� personalizar vuestra experiencia en EL PA?S.

?Tienes una suscripci��n de empresa? Accede aqu�� para contratar m��s cuentas.

En el caso de no saber qui��n est�� usando tu cuenta, te recomendamos cambiar tu contrase?a aqu��.

Si decides continuar compartiendo tu cuenta, este mensaje se mostrar�� en tu dispositivo y en el de la otra persona que est�� usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu�� los t��rminos y condiciones de la suscripci��n digital.