Datos de m¨®viles predicen en qu¨¦ zona de Londres suceder¨¢ un crimen
Combinados con informaci¨®n sobre cada barrio, los investigadores pudieron determinar con un 70% de eficacia qu¨¦ zonas de la ciudad sufrir¨ªan actos criminales el mes siguiente
?Cu¨¢nto dar¨ªa un buen alcalde o su jefe de polic¨ªa por saber en qu¨¦ barrio de la ciudad se va a producir un crimen? Pues un grupo de investigadores s¨®lo ha necesitado un perfil sociodemogr¨¢fico de la zona y la actividad de sus antenas de m¨®viles para predecir, con hasta un 70% de grado de acierto, en qu¨¦ zona se cometer¨¢ un robo o un asesinato en las calles de Londres. Todo un ejemplo de que el Big Data tambi¨¦n sirve para el bien com¨²n.
En los ¨²ltimos a?os se creado un gran negocio alrededor de la predicci¨®n del crimen. Apoyadas en las estad¨ªsticas policiales, empresas como IBM han desarrollado herramientas de an¨¢lisis predictivo que dan pistas de d¨®nde se va a cometer un asalto o el robo de un coche. Ya son muchas las polic¨ªas, en especial en Estados Unidos, que usan estos complejos y caros sistemas de miner¨ªa de datos. Pero, ?Hay alguna forma m¨¢s econ¨®mica, asequible y eficaz de mejorar sus predicciones? S¨ª, con los datos de los m¨®viles y sin saber nada de la identidad de sus usuarios, s¨®lo con la actividad recogida en las antenas de telefon¨ªa m¨®vil.
Durante la Campus Party de 2013 celebrada en Londres, el Instituto Tecnol¨®gico de Massachussets (MIT), el brit¨¢nico Instituto de Datos Abiertos y Telef¨®nica retaron a varios equipos de investigadores a sacarle el mayor jugo posible a grandes cantidades de datos. Una de esas bases de datos es Smart Steps, un producto de la operadora espa?ola (por ahora s¨®lo disponible en Reino Unido), que usa los datos m¨®viles de red an¨®nimos y agregados para calcular cu¨¢nta gente hay en una zona determinada.
¡°Usando los datos conocidos del barrio [variables como su demograf¨ªa, su perfil ¨¦tnico, clase social, tipo de casas...] se puede predecir en un 62% si habr¨¢ un crimen, con Smart Steps, el porcentaje se eleva hasta el 68% y combinado ambos tipos de datos a¨²n m¨¢s¡±, asegura la directora cient¨ªfica de Telef¨®nica Research y coautora de un estudio sobre la predicci¨®n del crimen en Londres, Nuria Oliver.
Los investigadores dividieron Londres en 124.119 cuadr¨ªculas. Con los datos del Open Data Institute pudieron hacer un perfil exacto de cada celda con 68 variables, desde su historial de cr¨ªmenes hasta el el tiempo, pasando por el r¨¦gimen de propiedad t¨ªpico de los inmuebles de la zona. Y, sobre esa capa, a?adieron los datos del tr¨¢fico recogido durante tres semanas por las antenas de telefon¨ªa m¨®vil de O2 (la filial de Telef¨®nica en el Reino Unido) previamente anonimizados y agregados. A pesar de esta salvaguarda de la privacidad, los investigadores pudieron hacer una estimaci¨®n de la edad, sexo y si el tr¨¢fico proced¨ªa de los m¨®viles de residentes del barrio, trabajadores o personas que iban de paso.
¡°Para cada localizaci¨®n, computamos una respuesta a la variable alta criminalidad-baja criminalidad basada en la base de datos con los casos criminales geolocalizados facilitada por la polic¨ªa de Londres, explica el investigador de la Universidad de Trento (Italia) y principal autor de la investigaci¨®n publicada en Arxiv, Andrey Bogomolov.
Por desgracia y por razones de privacidad, las autoridades hab¨ªan eliminado de los registros la fecha exacta en que se hab¨ªa producido cada crimen y s¨®lo estaban catalogados por meses. Por eso, su modelo s¨®lo era capaz de se?alar qu¨¦ cuadr¨ªcula en la que hab¨ªan dividido el Gran Londres hab¨ªa caer¨ªa en la categor¨ªa alta criminalidad (o baja) en el siguiente mes. A¨²n as¨ª el mapa generado gracias a sus algoritmos coincid¨ªa casi en un 70% con la distribuci¨®n geogr¨¢fica de los cr¨ªmenes en el mes estudiado. ¡°Creo que, con los datos diarios, las m¨¦tricas de predicci¨®n ser¨ªan mucho mejores¡±, asegura Bogomolov.
Y dice a¨²n m¨¢s. Aunque no era el objetivo de su estudio, con los datos inferidos del tr¨¢fico de los m¨®viles, hay cr¨ªmenes que se pueden predecir mejor que otros. ¡°Desafortunadamente, no ten¨ªamos todos los datos sobre los cr¨ªmenes durante el tiempo que dur¨® el reto¡±, reconoce el investigador. Sin embargo, ya s¨ª los tienen y est¨¢n trabajando en la publicaci¨®n de sus resultados, que presentar¨¢n en el congreso ICMI 2014.
¡°La gran ventaja de los datos m¨®viles es que se pueden hacer estimaciones casi en tiempo real¡±, recuerda la investigadora espa?ola. A diferencia de las estad¨ªsticas oficiales, de los censos, que se elaboran y publican en lapsos de tiempo muy grandes, la informaci¨®n ofrecida por las redes de telefon¨ªa m¨®vil est¨¢ disponible al instante.
Adem¨¢s, inferir la conducta humana de este tipo de datos es m¨¢s barato que hacerlo desde las herramientas que usan el Big Data para hacer an¨¢lisis predictivo. Productos como el SPSS de IBM necesitan un mar de datos de todo tipo, un gran centro de datos para almacenarlos y muchos ingenieros para analizarlos. ¡±Somos los primeros que ha resuelto este problema del Big Data con los datos de telecomunicaciones, que son muy accesibles y baratos de recoger. Redes GSM hay en todas la meg¨¢polis del mundo¡±, recuerda Bogomolov.
Tu suscripci¨®n se est¨¢ usando en otro dispositivo
?Quieres a?adir otro usuario a tu suscripci¨®n?
Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.
FlechaTu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.
En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.