Chile busca a los desaparecidos de la dictadura de Pinochet de la mano de la inteligencia artificial
A fines de agosto, Boric lanz¨® el Plan de B¨²squeda de m¨¢s de 1.000 chilenos. Hoy, viejos expedientes judiciales, muchos escritos a m¨¢quina, han sido digitalizados para aplicar tecnolog¨ªa y cruzar datos


El lunes 15, en la inauguraci¨®n del Congreso del Futuro en Santiago, el presidente Gabriel Boric dijo que la inteligencia artificial, la tem¨¢tica que aborda la versi¨®n n¨²mero 13 del encuentro, ¡°jugar¨¢ un rol importante en la b¨²squeda de nuestros detenidos desaparecidos¡±. Se refer¨ªa al Plan de B¨²squeda de m¨¢s de 1.000 personas que fueron v¨ªctimas de la dictadura de Augusto Pinochet (1973-1990) y que su Administraci¨®n present¨® el 30 de agosto de 2023, en la v¨ªspera de la conmemoraci¨®n el 11 de septiembre de los 50 a?os del golpe de Estado en el que fue derrocado el presidente socialista Salvador Allende.
El plan, que lidera el ministro de Justicia Luis Cordero, es una iniciativa que pretende convertirse en una pol¨ªtica permanente de Estado. Seg¨²n datos de Justicia, tras la dictadura en Chile hubo 1.469 v¨ªctimas de desaparici¨®n forzada y de ellas, 1.092 son detenidas desaparecidas, mientras que 377, que fueron ejecutadas, est¨¢n en la misma condici¨®n. Hasta ahora solo 307 han sido identificadas.
Para emprender esta nueva b¨²squeda, que ya han hecho los tribunales, Cordero dice a EL PA?S que se trabaja con dos principales fuentes. Por un lado, las investigaciones judiciales, que comprenden millones de p¨¢ginas. Y por otro, los antecedentes administrativos de los casos que est¨¢n dispersos en reparticiones del Estado. Entre ellas, el Programa de Derechos Humanos, creado en 1997, que depende de la cartera de Justicia, adem¨¢s de antiguas indagatorias en fiscal¨ªas militares (que sol¨ªan cerrar los casos) y los expedientes que sirvieron de base para el Informe de la Comisi¨®n Verdad y Reconciliaci¨®n de 1991, impulsado por el expresidente Patricio Aylwin (1990-1994), y en el que por primera vez se hizo un relato sobre las v¨ªctimas.
Chile ocupa un lugar de liderazgo en Am¨¦rica Latina en cuanto a discusi¨®n sobre Inteligencia Artificial, tema central del @congresofuturo 2024.
— Gobierno de Chile (@GobiernodeChile) January 15, 2024
El Presidente @GabrielBoric destaca los actuales usos de esta herramienta en el Estado, se?alando la importancia de acompa?ar su¡ pic.twitter.com/HSJhQ8hNgY
Escritos a m¨¢quina
Tras el an¨¢lisis tecnol¨®gico de la informaci¨®n, que el Programa de DD.HH. ya tiene digitalizado mientras que en el Poder Judicial lo est¨¢ en un 80%, se encuentra Unsholster, una empresa especializada en an¨¢lisis de datos, data science y desarrollo de software, cuyo gerente general es el ingeniero civil Antonio D¨ªaz-Araujo. En el contexto de Plan de B¨²squeda la firma se adjudic¨® el proyecto en una licitaci¨®n: es la encargada de aplicar inteligencia artificial.
Un dato relevante en este trabajo es que los expedientes judiciales, separados por cada caso, fueron tramitados en el antiguo sistema de justicia chileno (cambi¨® en 2005), lo que implica que las indagatorias de los jueces est¨¢ en papel: gran parte tienen las hojas cosidas a mano para armar un cuaderno, con tipeo con m¨¢quina de escribir e, incluso, hay varias partes manuscritas. Son los que contienen declaraciones, fotograf¨ªas en blanco y negro, fotocopias de fotos, informes periciales y viejos partes policiales.
Pero, adem¨¢s, una base de informaci¨®n crucial en los an¨¢lisis, m¨¢s actualizada, ser¨¢n las indagatorias judiciales que partir del a?o 2000, cuando se reabrieron cientos de causas que hab¨ªan sido archivadas en la dictadura, emprendieron los jueces con dedicaci¨®n exclusiva para casos de violaciones a los derechos humanos con sentencias.
Cordero se?ala que ¡°es mucha la informaci¨®n que est¨¢ en manos del Estado y no hay capacidad humana para procesarla, pues requiere ser vinculada una con otra. Por ejemplo, hay testimonios que est¨¢n en unos expedientes y no en otros. Y, adem¨¢s, dependiendo de los jueces hubo l¨ªneas investigativas, por lo que pudo haber antecedentes que fueron ¨²tiles para unos y no para otros¡±. Por ello, dice que la inteligencia artificial puede ser fundamental, pues dice que en estos casos el cruce de informaci¨®n ser¨¢ clave.
¡°Toda esa informaci¨®n est¨¢ entre expedientes judiciales y administrativos y la digitalizaci¨®n, lo primero que logra, es poder integrarlas en un lugar. Y luego trabajar con inteligencia artificial, lo que nos permite reducir las brechas de investigaci¨®n con algoritmos, que se van probando, y que van leyendo en esos expedientes, por ejemplo, fechas, nombres, lugares¡±, agrega el ministro.
4,7 millones de p¨¢ginas, por ahora
Hoy Unsholster est¨¢ en una etapa de anteproyecto, antes de empezar a programar, explica D¨ªaz-Araujo a EL PA?S. ¡°Pero ya hemos tocado gran parte de los tipos de archivos que vamos a tener que tocar¡±, se?ala. Los documentos que han ido llegando, escaneados previamente hoja por hoja, se encuentran en carpetas, en formato PDF, por lo que no tienen una l¨®gica que permita buscar datos pues est¨¢n grabados como imagen. Por ello, lo primero ha sido comenzar a aplicar la tecnolog¨ªa OCR (reconocimiento ¨®ptico de caracteres) a fin de que se transformen en datos.
Por ejemplo, ya tienen informaci¨®n ¨Cque no incluye todav¨ªa a los miles de expedientes del Poder Judicial¨C que suma 46.768 archivos PDF, lo que equivale a m¨¢s de 4,7 millones de p¨¢ginas. ¡°Si una persona se pusiera a leer cada una de esas p¨¢ginas, en voz alta y sin entender ni relacionar hechos, estar¨ªa leyendo ocho horas al d¨ªa durante 27 a?os¡±, explica el ingeniero civil.
Una vez que esos archivos son llevados a p¨¢ginas es cuando se crea, dice D¨ªaz-Araujo, ¡°un gran ¨¢rbol de clasificaci¨®n, que permite clasificar hojas que tienen im¨¢genes, manuscritos, m¨¢quina de escribir o archivos estilo word. Y luego empezar a aplicar, en cada una de ellas, el mejor OCR¡± para cada tipo de p¨¢gina, pues la clave, a?ade, est¨¢ en ¡°qu¨¦ material se lleva a cada una¡±.
Otra etapa es crear, explica, distintos tipos de diccionarios y entidades ¡°que vayan aprendiendo con el uso¡±. Por ejemplo, apodos de las personas, lugares, calles (muchas han cambiado de nombres desde la dictadura), formas de escribir y fechas.
Esto implica, detalla, crear una topolog¨ªa de entidades en la lectura, con tecnolog¨ªa, de cada uno de los textos ¡°que sea capaz de ir correlacionando r¨¢pidamente distintas p¨¢ginas, personas, lugares y fechas en forma muy flexible¡±. Ejemplifica: ¡°Muchos de los victimarios pueden tener apodos, y varios de estos pueden estar escritos de distinta manera, pero no por ello no se van a unir. Lo que haces es crear tecnolog¨ªa que sea capaz de sugerir al analista otras correlaciones que se vayan dando en el tiempo¡±.
Por lo tanto, profundiza, ¡°hay inteligencia artificial en la clasificaci¨®n de los documentos; hay alta inteligencia en transformar los documentos desde una imagen a datos buscables y luego, mucha, en la creaci¨®n de entidades que permite unir unos documentos con otros. Y, finalmente, lo que es m¨¢s necesario en una plataforma, es que ¨¦sta sea sobre la posibilidad de hacer competir algoritmos, de inteligencia artificial o no, sobre estos datos. Pero que no se calce con una tecnolog¨ªa, pues la mayor clave es estar abiertos a nuevas tecnolog¨ªas del futuro. Si lo dejas cerrado, se transforma en un escollo¡±.
Y a?ade: ¡°Otra clave de esta plataforma es que los datos orginales, y los transformados, permanecen. Pero se puede seguir creando otros datos arriba de esos. No hay una m¨¢quina del tiempo que haga una suerte de congelamiento de la capacidad de producir m¨¢s algoritmos y m¨¢s informaci¨®n con nuevas plataformas el d¨ªa de ma?ana¡±.
Contreras y Krassnoff
A cinco meses desde que se comenz¨® a aplicar tecnolog¨ªa a los casi 47.000 documentos del Programa de Derechos Humanos que tiene Unholster, ya es posible, con la aplicaci¨®n de los primeros OCR a los documentos identificatorios, rut, encontrar miles de menciones de al menos cuatro militares que fueron parte de la polic¨ªa secreta de Pinochet, la temida DINA.
Manuel Contreras, su director general, condenado al momento de su muerte en 2015 a 526 a?os de c¨¢rcel por cientos de cr¨ªmenes, aparece 2.800 veces; Pedro Espinoza y Miguel Krassnoff, ambos cumplen sentencias en el penal Punta Peuco, 2.079 y 2.954 menciones, respectivamente. Y Marcelo Moren Brito, quien fue el torturador de ?ngela Jeria, la madre de la expresidenta socialista Michelle Bachelet, 2.284.
Por ahora son solo menciones. Pero en adelante, los nombres, hechos, fechas y lugares, podr¨¢n unirse y relacionarse, dice D¨ªaz-Araujo.
Suscr¨ªbase aqu¨ª a la newsletter de EL PA?S Chile y reciba todas las claves informativas de la actualidad del pa¨ªs.
Tu suscripci¨®n se est¨¢ usando en otro dispositivo
?Quieres a?adir otro usuario a tu suscripci¨®n?
Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.
FlechaTu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.
?Tienes una suscripci¨®n de empresa? Accede aqu¨ª para contratar m¨¢s cuentas.
En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.
Sobre la firma
