Dos investigaciones dotan de visi��n m��s ��humana�� a coches sin conductor

Los estudios avanzan en sistemas para que veh��culos y robots miren, analicen y discriminen la informaci��n relevante para tomar decisiones en milisegundos

La imagen muestra tanto la informaci��n de la c��mara a color como la procedente de la de eventos (puntos azules y rojos) generada por un peat��n que corre frente a un veh��culo.Grupo de Rob��tica y Percepci��n, Universidad de Z��rich, Suiza

Ra��l Lim��n

29 may 2024 - 17:00CEST

Los veh��culos de conducci��n aut��noma dependen de un sentido tan crucial para el ser humano como la visi��n. No se trata solo de que la m��quina sea capaz de ver, que ya lo hace, sino de mirar, analizar, discriminar y proceder en milisegundos. El reto es alcanzar esta caracter��stica de las personas en el tiempo justo para tomar la decisi��n necesaria. Para una m��quina, por ejemplo, ver un ��rbol junto a la v��a es f��cil. Lo dif��cil es saber que no es un objeto que se va a mover ni a interponer en el camino, y lo contrario si se trata de un peat��n. La revista cient��fica Nature publica este mi��rcoles dos avances en este sentido: un procesador para responder r��pidamente a un evento con la m��nima informaci��n y un nuevo sistema (algoritmo) para mejorar la precisi��n de la visi��n mec��nica con menor latencia (tiempo de respuesta).

Estas investigaciones, que son fundamentales para el desarrollo de veh��culos de conducci��n aut��noma o la rob��tica, ya cuentan con desarrollos avanzados en el Instituto de Microelectr��nica (Imse) en la capital andaluza, del Consejo Superior de Investigaciones Cient��ficas (CSIC) y la Universidad de Sevilla. Multinacionales como Samsung y Sony ya usan las patentes que comercializa la empresa Prophesee.

Los dos trabajos que publica Nature son innovaciones sobre estos sistemas basados en la foveaci��n, el mecanismo humano que permite maximizar la resoluci��n en la zona donde se enfoca la vista, mientras que la baja en las ��reas de visi��n perif��rica no relevante. De esta forma, se reduce la cantidad de informaci��n, pero se mantiene la capacidad de reconocimiento visual de los datos imprescindibles para la toma de decisiones en milisegundos.

La clave es la interpretaci��n precisa de la escena y una r��pida detecci��n de movimiento para permitir reacciones inmediatas. Las c��maras convencionales pueden captar la imagen de un encuadre y la reproducen a alt��sima resoluci��n, pero toda esa informaci��n tiene que ser procesada y discriminada, lo que supone un tiempo y un gasto de recursos incompatibles con las decisiones instant��neas que exige la conducci��n aut��noma o la rob��tica avanzada.

Uno de los avances lo firman Daniel Gehrig, investigador de la Universidad de Pensilvania (EE UU), y Davide Scaramuzza, profesor de rob��tica en la Universidad de Z��rich (Suiza). Ambos han abordado la dificultad de la toma de decisiones con im��genes de alta resoluci��n a color. Estas precisan un gran ancho de banda para ser procesadas con la fluidez necesaria y reducir esta alta capacidad a costa de mayor latencia, de m��s tiempo para responder. La alternativa es usar una c��mara de eventos, las que procesan flujos continuos de impulsos, pero sacrificando precisi��n.

La imagen muestra tanto la informaci��n de la c��mara a color como los eventos (puntos azules y rojos) de la de eventos; Los cuadros delimitadores muestran la detecci��n de peatones por parte del algoritmo.Grupo de Rob��tica y Percepci��n, Universidad de Z��rich, Suiza

Para hacer frente a estas limitaciones, los autores han desarrollado un sistema h��brido que logra la detecci��n eficaz de objetos con la m��nima latencia. El algoritmo combina la informaci��n de dos c��maras: una que reduce la velocidad de los fotogramas en color para reducir el ancho de banda necesario y otra de eventos que compensa esa p��rdida de latencia, garantizando que los objetos que se mueven r��pidamente, como peatones y autom��viles, puedan ser detectados. ��Los resultados allanan el camino hacia la detecci��n eficiente y precisa de objetos, especialmente en escenarios extremos��, afirman los investigadores.

��Es un gran avance. Los sistemas actuales de asistencia al conductor, como los de MobileEye ��que est��n integrados en m��s de 140 millones de autom��viles en todo el mundo�� funcionan con c��maras est��ndar que toman 30 fotogramas por segundo, es decir, una imagen cada 33 milisegundos. Adem��s, requieren un m��nimo de tres fotogramas para detectar de forma fiable a un peat��n o a un coche. Esto eleva el tiempo total para iniciar la maniobra de frenado a 100 milisegundos. Nuestro sistema permite reducir este tiempo por debajo de un milisegundo sin necesidad de utilizar una c��mara de alta velocidad, lo que supondr��a un enorme coste computacional��, explica Scaramuzza.

Los sistemas actuales elevan el tiempo total para iniciar la maniobra de frenado a 100 milisegundos. Nuestro algoritmo permite reducir este tiempo por debajo de un milisegundo sin necesidad de utilizar una c��mara de alta velocidad
Davide Scaramuzza, profesor de rob��tica en la Universidad de Z��rich (Suiza)

La tecnolog��a ha sido ��transferida a una empresa de primer nivel��, seg��n explica el investigador. ��Si se aprobara, por lo general, pueden pasar muchos a?os desde una prueba de concepto hasta las de impacto y la implementaci��n final��, a?ade.

Por su parte, Luping Shi, director del Centro de Investigaci��n de Computaci��n Inspirada en el Cerebro (CBICR por sus siglas en ingl��s) de la Universidad de Tsinghua (China), ha desarrollado con su equipo el chip (procesador) Tianmouc. Inspirado en la forma en que funciona el sistema visual humano, combina percepciones r��pidas e imprecisas, como las de la visi��n perif��rica humana, con otras de mayor resoluci��n y m��s lentas para procesarlas.

De esta forma, el chip trabaja tambi��n como una c��mara de eventos, que en vez de fotogramas completos procesa flujos continuos de impulsos el��ctricos (eventos o spikes) registrados por cada fotosensor cuando detecta un cambio suficiente de luz. ��Tianmouc tiene una matriz de p��xeles h��bridos: unos de baja precisi��n, pero de r��pida detecci��n, basados en eventos para permitir respuestas r��pidas a los cambios sin necesidad de demasiados detalles y otros de procesamiento lento para producir una visualizaci��n precisa de la escena��, explica el investigador. El chip se ha probado en escenarios como un t��nel oscuro iluminado repentinamente por una luz deslumbrante o en una carretera por la que cruza un peat��n.

Bernab�� Linares, profesor de investigaci��n del Imse y responsable de la c��mara de eventos comercial de mayor resoluci��n, resalta que Scaramuzza utiliza drones para recoger im��genes de forma convencional y con c��maras de evento. ��El avance es el algoritmo utilizado para el reconocimiento de los objetos y el resultado es interesante��, resalta.

El Imse trabaja principalmente con los procesadores, y se?ala que desarrollos algor��tmicos como los de la Universidad de Z��rich son fundamentales como complemento de los chips y para aplicaciones rob��ticas. Al ser tecnolog��as muy compactas, precisan de sistemas de c��lculos ligeros y que consuman poca energ��a. ��Para los drones es un desarrollo importante. Les viene muy bien este tipo de c��maras de evento��, resalta.

El trabajo de Luping Shi es m��s cercano a los desarrollos del Grupo de Sistemas Neurom��rficos del Imse. En este caso se trata de un procesador h��brido. ��Los p��xeles se van alternando y va calculando diferencias espaciales. Almacena la luz de una imagen y la siguiente y calcula el cambio. Si no hay modificaci��n, la diferencia es cero. Aporta datos con muy poca frecuencia a partir de un sensor bastante sofisticado��, explica Linares.

Aunque los usos destacados por Nature se orientan a la conducci��n aut��noma, los avances en visi��n tienen gran relevancia en rob��tica, que tambi��n precisa de capacidad de discriminar informaci��n para tomar decisiones a gran velocidad. Es el caso de los procesos de automatizaci��n industrial. ��Pero a los fabricantes de autom��vil les interesa mucho porque buscan todo tipo de desarrollos, ya que as�� es m��s seguro y pueden sacar el mejor partido a cada tecnolog��a��, explica Linares, quien resalta que Renault es uno de los inversores de Prophesee.

Puedes seguir a EL PA?S Tecnolog��a en Facebook y X o apuntarte aqu�� para recibir nuestra newsletter semanal.

Tu suscripci��n se est�� usando en otro dispositivo

?Quieres a?adir otro usuario a tu suscripci��n?

A?adir usuario Continuar leyendo aqu��

Si contin��as leyendo en este dispositivo, no se podr�� leer en el otro.

?Por qu�� est��s viendo esto?

Flecha

Tu suscripci��n se est�� usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.

Si quieres compartir tu cuenta, cambia tu suscripci��n a la modalidad Premium, as�� podr��s a?adir otro usuario. Cada uno acceder�� con su propia cuenta de email, lo que os permitir�� personalizar vuestra experiencia en EL PA?S.

En el caso de no saber qui��n est�� usando tu cuenta, te recomendamos cambiar tu contrase?a aqu��.

Si decides continuar compartiendo tu cuenta, este mensaje se mostrar�� en tu dispositivo y en el de la otra persona que est�� usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu�� los t��rminos y condiciones de la suscripci��n digital.

Sobre la firma

Ra��l Lim��n

Licenciado en Ciencias de la Informaci��n por la Universidad Complutense, m��ster en Periodismo Digital por la Universidad Aut��noma de Madrid y con formaci��n en EEUU, es redactor de la secci��n de Ciencia. Colabora en televisi��n, ha escrito dos libros (uno de ellos Premio Lorca) y fue distinguido con el galard��n a la Difusi��n en la Era Digital.