El cient¨ªfico de datos y la lucha contra el fraude
Uno de los aspectos m¨¢s relevantes de la ciencia de datos es su contribuci¨®n a detectar y monitorizar el comportamiento de los defraudadores y su capacidad de ayudar a reducir su n¨²mero
Las habilidades precognitivas de los inspectores del Sistema Precrimen de la pel¨ªcula Minority Report han dejado de ser un asunto de ciencia ficci¨®n gracias a la nueva ciencia de los datos y su principal protagonista, el data scientist, un perfil que se encuentra a medio camino entre el matem¨¢tico y el inform¨¢tico y cuya misi¨®n es obtener conocimiento a trav¨¦s del an¨¢lisis de los datos.
Estos profesionales tienen profundos conocimientos en estad¨ªstica, matem¨¢ticas y computaci¨®n cient¨ªfica, pueden trabajar con datos no estructurados procedentes de medios sociales, v¨ªdeos y audios y son capaces de transformar los problemas de negocio en modelos matem¨¢ticos tratables mediante algoritmos. Tambi¨¦n tienen grandes dotes de comunicaci¨®n para transmitir con claridad los resultados relevantes para la toma de decisiones. Como explica?Harvard Business Review, "el data scientist es un profesional con entrenamiento y curiosidad para tomar decisiones en el mundo del big data".
Los 2,5 trillones de bites generados cada d¨ªa en el mundo sugieren definir nuestra ¨¦poca como "la era del dato". Pero los datos por s¨ª solos no tienen mucho valor, al igual que el oro o la plata sirven de poco cuando est¨¢n formando parte de la acantita o la silvanita. Se necesita un procedimiento capaz de transformar esos datos en informaci¨®n y conocimiento, al igual que se requiere un procedimiento para transformar los minerales en las diferentes sustancias qu¨ªmicas ¨²tiles para la industria.
Gracias al uso de tecnolog¨ªas de anal¨ªtica de negocio, como el data science y el big data, las empresas pueden transformar la enorme cantidad de datos almacenados en conocimiento ¨²til para su negocio. Adem¨¢s, estas tecnolog¨ªas no se utilizan solo en el sector privado para incrementar las ventas de productos y servicios sino que, en algunos pa¨ªses, el sector p¨²blico tambi¨¦n las est¨¢ aplicando para conocer a los ciudadanos, promoviendo una relaci¨®n m¨¢s cercana con las personas y luchando contra el fraude fiscal.
- Demasiadas variables a tener en cuenta
Uno de los aspectos m¨¢s relevantes, aunque muy poco se?alado, de la ciencia de datos es su contribuci¨®n a la clasificaci¨®n de perfiles, detectando y monitorizando, por ejemplo, el comportamiento de los defraudadores y ayudando a reducir dr¨¢sticamente su n¨²mero. Los cient¨ªficos de datos trabajan sobre millones de contribuyentes caracterizados por miles de variables vinculadas con los modelos de declaraci¨®n de los impuestos y con cientos de millones de relaciones entre personas y/o empresas recogidas en las bases de datos.
Generalmente se trabaja sobre la hip¨®tesis de que los defraudadores se parecen entre s¨ª y se distinguen de los honrados, lo que supone la implementaci¨®n de algoritmos basados en estad¨ªstica multivariante que, mezclados con las t¨¦cnicas inteligencia artificial, forman los algoritmos de machine learning o aprendizaje autom¨¢tico. Estos algoritmos se utilizan, por ejemplo, para reconocer los perfiles de empresas que emiten facturas falsas, agrup¨¢ndolas y clasific¨¢ndolas, lo cual nos puede ayudar a detectar este tipo de fraude con un porcentaje de acierto de en torno al 90%.
- La teor¨ªa criminol¨®gica de la asociaci¨®n diferencial: las amistades peligrosas
Otra hip¨®tesis sobre la que trabaja el cient¨ªfico de datos y que afecta principalmente a tramas de blanqueo de capitales procede de la famosa teor¨ªa criminol¨®gica de la asociaci¨®n diferencial, seg¨²n la cual a medida que un individuo est¨¢ m¨¢s expuesto al delito (tanto por la cantidad de delincuentes con los que se relaciona, como por la duraci¨®n y estabilidad de estas relaciones) aumentan las probabilidades de que dicho individuo se convierta en un delincuente. En efecto en nuestro caso asumimos que los defraudadores colaboran entre s¨ª y aprenden unos de otros, lo que trae consigo la realizaci¨®n de an¨¢lisis de redes formadas por cientos de millones de relaciones.
Por ejemplo, para detectar un tipo particular de tramas de blanqueo de capitales, se buscan grupos de empresas con una enorme cantidad de relaciones comerciales entre ellas y muy pocas con el exterior, calcul¨¢ndose un ¨ªndice de aislamiento para cada trama, que de ser suficientemente alto puede ser seleccionada para su estudio en detalle. Si adem¨¢s la trama est¨¢ constituida por personas jur¨ªdicas estrechamente relacionadas m¨¢s all¨¢ de sus transacciones comerciales, la posibilidad de estar ante una trama de blanqueo de capitales se multiplica. De este modo se detectan unas 200 tramas anuales que mueven cientos de millones de euros en nuestro pa¨ªs.
En general el inspector tiene que basarse en su experiencia e instinto, encontrar diferencias notables al cruzar datos de diferentes impuestos o tener suerte para detectar las anomal¨ªas que mediante el uso de los algoritmos adecuados pueden ser detectadas autom¨¢ticamente y de forma masiva. As¨ª, la tecnolog¨ªa no solo permite ahorrar dinero, sino tambi¨¦n una cantidad considerable de horas de trabajo y esfuerzo.
Eloy Vicente Cestero es responsable de data science en Sopra Steria Espa?a.
Tu suscripci¨®n se est¨¢ usando en otro dispositivo
?Quieres a?adir otro usuario a tu suscripci¨®n?
Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.
FlechaTu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.
En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.