El fraude financiero continúa siendo una problemática creciente a nivel global, y Estados Unidos no es la excepción. En 2024, las pérdidas de los consumidores alcanzaron los 12,5 mil millones de dólares, un incremento del 25% respecto al año anterior, según la Comisión Federal de Comercio. No es solo la frecuencia de los ataques lo que ha aumentado, sino su sofisticación, lo que ha dejado obsoletos muchos enfoques tradicionales de prevención que analizan las transacciones de manera aislada.
Las redes neuronales gráficas (GNN) se presentan como una solución efectiva a este desafío. Estas redes modelan las relaciones entre entidades, como usuarios y sus dispositivos, ubicaciones o métodos de pago compartidos. A diferencia de los métodos convencionales, las GNN son capaces de identificar esquemas complejos de fraude al analizar tanto la estructura de las redes como los atributos de las entidades involucradas. No obstante, implementar GNN para prevenir fraudes en línea conlleva desafíos, como asegurar respuestas en menos de un segundo y escalar a grandes volúmenes de datos.
GraphStorm ha emergido para abordar justamente estos retos. La versión 0.5 introduce capacidades de inferencia en tiempo real que superan las limitaciones de soluciones previas. Anteriormente, la Deep Graph Library (DGL) permitía tiempos de respuesta rápidos pero a costa de una compleja orquestación de servicios. Otras implementaciones reducían esta complejidad, enfrentando problemas de escalabilidad cuando se trataba de datos empresariales amplios.
Con GraphStorm, el proceso de entrenamiento de redes neuronales gráficas se ha simplificado gracias al entrenamiento distribuido y a sus APIs de alto nivel. Esta evolución ha sido demostrada con un modelo entrenado a escala empresarial y capacidades de inferencia offline. Sin embargo, detectar el fraude antes de que ocurra es crucial para la prevención de pérdidas financieras. Ahora, GraphStorm v0.5 permite inferencias en tiempo real aprovechando Amazon SageMaker AI.
El sistema propuesto incluye un proceso de cuatro pasos que comienza con la exportación de gráficos de transacciones desde una base de datos OLTP a un almacenamiento escalable. Continúa con el entrenamiento del modelo, una implementación simplificada, y la integración de aplicaciones de cliente para manejar flujos de transacciones en tiempo real. Este enfoque permite que los científicos de datos pasen modelos GNN entrenados a puntos de inferencia listos para producción con mínima carga operativa.
La utilización de conjuntos de datos como el de IEEE-CIS, con 500,000 transacciones anonimizadas, facilita que las GNN detecten patrones de fraude mediante la relación de entidades. Al buscar combatir las amenazas de fraude, las organizaciones pueden adaptar los modelos basados en GNN para desarrollar soluciones personalizadas, haciendo más accesible la prevención eficaz del fraude.