F¨ªsica cu¨¢ntica para proteger la privacidad en los algoritmos de aprendizaje autom¨¢tico
Las llamadas redes tensoriales son prometedoras candidatas para el desarrollo de inteligencias artificiales m¨¢s seguras y transparentes
Los avances en inteligencia artificial, especialmente en la rama del aprendizaje autom¨¢tico, est¨¢n desbocados. Dentro de la larga lista de aplicaciones recientes destacan el archiconocido ChatGPT o Gemini, que adem¨¢s de texto procesa im¨¢genes, audio y v¨ªdeo. Para poner en marcha estos modelos se usan grandes cantidades de datos que, en ocasiones, son confidenciales. Un ejemplo es el caso de algoritmos que ayudan en el diagn¨®stico y tratamiento de enfermedades, que emplean datos m¨¦dicos personales. Por ello, es fundamental encontrar formas de preservar la privacidad de los datos usados. Un reciente enfoque hace uso de conceptos matem¨¢ticos de la f¨ªsica cu¨¢ntica para hacer frente a este reto.
En concreto, se trata de estudiar las simetr¨ªas que aparecen en los par¨¢metros del modelo, es decir, en los n¨²meros que lo configuran. Los algoritmos (o modelos) de inteligencia artificial son, al fin y al cabo, complejas funciones que procesan la informaci¨®n recibida para realizar una predicci¨®n. Estas funciones est¨¢n definidas por unos n¨²meros llamados par¨¢metros ¡ªen el caso de ChatGPT, 220000 millones de ellos¨D, que determinan qu¨¦ porciones de la informaci¨®n se procesa y con qu¨¦ intensidad se hace. Por ejemplo, un modelo que anticipe el riesgo de padecer una enfermedad, r, a partir de la edad e, la altura a, y el peso p de cada persona, podr¨ªa ser r = (x.e + y.a) / z.p. Este modelo cuenta con tres par¨¢metros, x, y, y z, que determinan la intensidad con la que cada una de las variables de entrada ¡ªedad, altura y peso¨D influye en el riesgo; introduciendo los datos de un paciente concreto, el algoritmo har¨¢ la predicci¨®n sobre la posibilidad de que una persona con esas caracter¨ªsticas desarrolle la enfermedad.
El valor de los par¨¢metros se establece utilizando grandes conjuntos de datos de referencia, ya resueltos, para los cuales se conoce el resultado que se deber¨ªa obtener. Este proceso es el llamado entrenamiento. En el ejemplo del modelo anterior, los datos de entrenamiento ser¨ªan datos m¨¦dicos de un amplio n¨²mero de pacientes, con su correspondiente diagn¨®stico. Con ellos, se ajustan los par¨¢metros para maximizar las predicciones correctas en la referencia.
Resulta, pues, que la selecci¨®n de par¨¢metros de un modelo depende de los datos utilizados para entrenarlo. Y, aunque, en teor¨ªa, el modelo solamente aprende patrones de los datos de entrenamiento, en la pr¨¢ctica aprenden mucho m¨¢s. De hecho, varios cient¨ªficos han advertido que los par¨¢metros de estos algoritmos pueden indicar si un dato concreto form¨® parte de los datos que se usaron para entrenarlo, e incluso, en determinados casos, se pueden extraer de ellos los datos de entrenamiento completos.
En estas situaciones, una soluci¨®n es construir otro modelo, con otros par¨¢metros y con otros datos de entrenamiento, pero que para cada dato introducido haga exactamente la misma predicci¨®n que el original. Esta idea de ¡°diferentes par¨¢metros que describen el mismo modelo¡± corresponde a una entidad matem¨¢tica precisa: se trata del concepto de simetr¨ªa gauge.
Este t¨¦rmino no tiene solo inter¨¦s matem¨¢tico, sino que es un elemento fundamental en varias ¨¢reas de la f¨ªsica, como la relatividad general, la f¨ªsica de part¨ªculas, o la mec¨¢nica cu¨¢ntica. Ahora, un reciente trabajo ha demostrado que, efectivamente, si un algoritmo posee una de estas simetr¨ªas gauge, es posible construir otro que har¨¢ las mismas predicciones, cuyos par¨¢metros no est¨¢n relacionados con los datos utilizados para entrenar el modelo inicial. De esta manera, estudiar los par¨¢metros no podr¨¢ revelar informaci¨®n acerca de los datos de entrenamiento.
Entonces, el reto es encontrar algoritmos de inteligencia artificial que posean simetr¨ªas gauge. Esto no es sencillo, porque en inteligencia artificial las simetr¨ªas son vistas como propiedades no deseadas, de las que hay que deshacerse. Sin embargo, en el campo de la f¨ªsica cu¨¢ntica las simetr¨ªas gauge est¨¢n muy presentes y han sido muy estudiadas. Concretamente, las redes tensoriales, que se utilizan en la simulaci¨®n de sistemas cu¨¢nticos formados por muchas part¨ªculas, tienen este tipo de simetr¨ªa. Adem¨¢s, estas redes permiten modelar sistemas muy complicados, de forma similar a los algoritmos de inteligencia artificial. Esto ha hecho que las redes tensoriales hayan empezado a ser usadas como algoritmos de inteligencia artificial hace unos pocos a?os.
De momento, el modelado realizado por las redes tensoriales a¨²n no compite, en t¨¦rminos de calidad global, con el de otros algoritmos modernos m¨¢s populares ¡ªbasados en redes neuronales profundas, por ejemplo¨D. Sin embargo, han mostrado importantes ventajas, como la habilidad de entender qu¨¦ factores est¨¢n propiciando una predicci¨®n concreta. A estas virtudes ahora se a?ade otra, gracias a sus simetr¨ªas gauge: la protecci¨®n de la privacidad de los datos usados durante el entrenamiento. Esto sit¨²a a las redes tensoriales como candidatas muy prometedoras para el desarrollo de inteligencias artificiales, e ilustra de una manera muy clara c¨®mo ideas fundamentales en matem¨¢ticas y f¨ªsica cu¨¢ntica pueden tener un impacto en tecnolog¨ªas del d¨ªa a d¨ªa.
Alejandro Pozas es investigador posdoctoral en la Universidad de Ginebra, en Suiza.
Caf¨¦ y Teoremas es una secci¨®n dedicada a las matem¨¢ticas y al entorno en el que se crean, coordinado por el Instituto de Ciencias Matem¨¢ticas (ICMAT), en la que los investigadores y miembros del centro describen los ¨²ltimos avances de esta disciplina, comparten puntos de encuentro entre las matem¨¢ticas y otras expresiones sociales y culturales y recuerdan a quienes marcaron su desarrollo y supieron transformar caf¨¦ en teoremas. El nombre evoca la definici¨®n del matem¨¢tico h¨²ngaro Alfred R¨¦nyi: ¡°Un matem¨¢tico es una m¨¢quina que transforma caf¨¦ en teoremas¡±.
Edici¨®n, traducci¨®n y coordinaci¨®n: ?gata Tim¨®n Garc¨ªa-Longoria. Es coordinadora de la Unidad de Cultura Matem¨¢tica del Instituto de Ciencias Matem¨¢ticas (ICMAT)
Puedes seguir a MATERIA en Facebook, X e Instagram, o apuntarte aqu¨ª para recibir nuestra newsletter semanal.
Tu suscripci¨®n se est¨¢ usando en otro dispositivo
?Quieres a?adir otro usuario a tu suscripci¨®n?
Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.
FlechaTu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.
En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.