Dos investigaciones dotan de visi¨®n m¨¢s ¡®humana¡¯ a coches sin conductor
Los estudios avanzan en sistemas para que veh¨ªculos y robots miren, analicen y discriminen la informaci¨®n relevante para tomar decisiones en milisegundos
Los veh¨ªculos de conducci¨®n aut¨®noma dependen de un sentido tan crucial para el ser humano como la visi¨®n. No se trata solo de que la m¨¢quina sea capaz de ver, que ya lo hace, sino de mirar, analizar, discriminar y proceder en milisegundos. El reto es alcanzar esta caracter¨ªstica de las personas en el tiempo justo para tomar la decisi¨®n necesaria. Para una m¨¢quina, por ejemplo, ver un ¨¢rbol junto a la v¨ªa es f¨¢cil. Lo dif¨ªcil es saber que no es un objeto que se va a mover ni a interponer en el camino, y lo contrario si se trata de un peat¨®n. La revista cient¨ªfica Nature publica este mi¨¦rcoles dos avances en este sentido: un procesador para responder r¨¢pidamente a un evento con la m¨ªnima informaci¨®n y un nuevo sistema (algoritmo) para mejorar la precisi¨®n de la visi¨®n mec¨¢nica con menor latencia (tiempo de respuesta).
Estas investigaciones, que son fundamentales para el desarrollo de veh¨ªculos de conducci¨®n aut¨®noma o la rob¨®tica, ya cuentan con desarrollos avanzados en el Instituto de Microelectr¨®nica (Imse) en la capital andaluza, del Consejo Superior de Investigaciones Cient¨ªficas (CSIC) y la Universidad de Sevilla. Multinacionales como Samsung y Sony ya usan las patentes que comercializa la empresa Prophesee.
Los dos trabajos que publica Nature son innovaciones sobre estos sistemas basados en la foveaci¨®n, el mecanismo humano que permite maximizar la resoluci¨®n en la zona donde se enfoca la vista, mientras que la baja en las ¨¢reas de visi¨®n perif¨¦rica no relevante. De esta forma, se reduce la cantidad de informaci¨®n, pero se mantiene la capacidad de reconocimiento visual de los datos imprescindibles para la toma de decisiones en milisegundos.
La clave es la interpretaci¨®n precisa de la escena y una r¨¢pida detecci¨®n de movimiento para permitir reacciones inmediatas. Las c¨¢maras convencionales pueden captar la imagen de un encuadre y la reproducen a alt¨ªsima resoluci¨®n, pero toda esa informaci¨®n tiene que ser procesada y discriminada, lo que supone un tiempo y un gasto de recursos incompatibles con las decisiones instant¨¢neas que exige la conducci¨®n aut¨®noma o la rob¨®tica avanzada.
Uno de los avances lo firman Daniel Gehrig, investigador de la Universidad de Pensilvania (EE UU), y Davide Scaramuzza, profesor de rob¨®tica en la Universidad de Z¨²rich (Suiza). Ambos han abordado la dificultad de la toma de decisiones con im¨¢genes de alta resoluci¨®n a color. Estas precisan un gran ancho de banda para ser procesadas con la fluidez necesaria y reducir esta alta capacidad a costa de mayor latencia, de m¨¢s tiempo para responder. La alternativa es usar una c¨¢mara de eventos, las que procesan flujos continuos de impulsos, pero sacrificando precisi¨®n.
Para hacer frente a estas limitaciones, los autores han desarrollado un sistema h¨ªbrido que logra la detecci¨®n eficaz de objetos con la m¨ªnima latencia. El algoritmo combina la informaci¨®n de dos c¨¢maras: una que reduce la velocidad de los fotogramas en color para reducir el ancho de banda necesario y otra de eventos que compensa esa p¨¦rdida de latencia, garantizando que los objetos que se mueven r¨¢pidamente, como peatones y autom¨®viles, puedan ser detectados. ¡°Los resultados allanan el camino hacia la detecci¨®n eficiente y precisa de objetos, especialmente en escenarios extremos¡±, afirman los investigadores.
¡°Es un gran avance. Los sistemas actuales de asistencia al conductor, como los de MobileEye ¡ªque est¨¢n integrados en m¨¢s de 140 millones de autom¨®viles en todo el mundo¡ª funcionan con c¨¢maras est¨¢ndar que toman 30 fotogramas por segundo, es decir, una imagen cada 33 milisegundos. Adem¨¢s, requieren un m¨ªnimo de tres fotogramas para detectar de forma fiable a un peat¨®n o a un coche. Esto eleva el tiempo total para iniciar la maniobra de frenado a 100 milisegundos. Nuestro sistema permite reducir este tiempo por debajo de un milisegundo sin necesidad de utilizar una c¨¢mara de alta velocidad, lo que supondr¨ªa un enorme coste computacional¡±, explica Scaramuzza.
Los sistemas actuales elevan el tiempo total para iniciar la maniobra de frenado a 100 milisegundos. Nuestro algoritmo permite reducir este tiempo por debajo de un milisegundo sin necesidad de utilizar una c¨¢mara de alta velocidadDavide Scaramuzza, profesor de rob¨®tica en la Universidad de Z¨²rich (Suiza)
La tecnolog¨ªa ha sido ¡°transferida a una empresa de primer nivel¡±, seg¨²n explica el investigador. ¡°Si se aprobara, por lo general, pueden pasar muchos a?os desde una prueba de concepto hasta las de impacto y la implementaci¨®n final¡±, a?ade.
Por su parte, Luping Shi, director del Centro de Investigaci¨®n de Computaci¨®n Inspirada en el Cerebro (CBICR por sus siglas en ingl¨¦s) de la Universidad de Tsinghua (China), ha desarrollado con su equipo el chip (procesador) Tianmouc. Inspirado en la forma en que funciona el sistema visual humano, combina percepciones r¨¢pidas e imprecisas, como las de la visi¨®n perif¨¦rica humana, con otras de mayor resoluci¨®n y m¨¢s lentas para procesarlas.
De esta forma, el chip trabaja tambi¨¦n como una c¨¢mara de eventos, que en vez de fotogramas completos procesa flujos continuos de impulsos el¨¦ctricos (eventos o spikes) registrados por cada fotosensor cuando detecta un cambio suficiente de luz. ¡°Tianmouc tiene una matriz de p¨ªxeles h¨ªbridos: unos de baja precisi¨®n, pero de r¨¢pida detecci¨®n, basados en eventos para permitir respuestas r¨¢pidas a los cambios sin necesidad de demasiados detalles y otros de procesamiento lento para producir una visualizaci¨®n precisa de la escena¡±, explica el investigador. El chip se ha probado en escenarios como un t¨²nel oscuro iluminado repentinamente por una luz deslumbrante o en una carretera por la que cruza un peat¨®n.
Bernab¨¦ Linares, profesor de investigaci¨®n del Imse y responsable de la c¨¢mara de eventos comercial de mayor resoluci¨®n, resalta que Scaramuzza utiliza drones para recoger im¨¢genes de forma convencional y con c¨¢maras de evento. ¡°El avance es el algoritmo utilizado para el reconocimiento de los objetos y el resultado es interesante¡±, resalta.
El Imse trabaja principalmente con los procesadores, y se?ala que desarrollos algor¨ªtmicos como los de la Universidad de Z¨²rich son fundamentales como complemento de los chips y para aplicaciones rob¨®ticas. Al ser tecnolog¨ªas muy compactas, precisan de sistemas de c¨¢lculos ligeros y que consuman poca energ¨ªa. ¡°Para los drones es un desarrollo importante. Les viene muy bien este tipo de c¨¢maras de evento¡±, resalta.
El trabajo de Luping Shi es m¨¢s cercano a los desarrollos del Grupo de Sistemas Neurom¨®rficos del Imse. En este caso se trata de un procesador h¨ªbrido. ¡°Los p¨ªxeles se van alternando y va calculando diferencias espaciales. Almacena la luz de una imagen y la siguiente y calcula el cambio. Si no hay modificaci¨®n, la diferencia es cero. Aporta datos con muy poca frecuencia a partir de un sensor bastante sofisticado¡±, explica Linares.
Aunque los usos destacados por Nature se orientan a la conducci¨®n aut¨®noma, los avances en visi¨®n tienen gran relevancia en rob¨®tica, que tambi¨¦n precisa de capacidad de discriminar informaci¨®n para tomar decisiones a gran velocidad. Es el caso de los procesos de automatizaci¨®n industrial. ¡°Pero a los fabricantes de autom¨®vil les interesa mucho porque buscan todo tipo de desarrollos, ya que as¨ª es m¨¢s seguro y pueden sacar el mejor partido a cada tecnolog¨ªa¡±, explica Linares, quien resalta que Renault es uno de los inversores de Prophesee.
Puedes seguir a EL PA?S Tecnolog¨ªa en Facebook y X o apuntarte aqu¨ª para recibir nuestra newsletter semanal.
Tu suscripci¨®n se est¨¢ usando en otro dispositivo
?Quieres a?adir otro usuario a tu suscripci¨®n?
Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.
FlechaTu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.
En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.