Volkswagen, el renombrado gigante automovilístico europeo, está redefiniendo la gestión del conocimiento en el ámbito de la producción gracias a una innovadora solución de inteligencia artificial generativa. Esta iniciativa se da en colaboración con el equipo de Prototipado e Ingeniería de Clientes de Amazon Web Services (AWSI-PACE), y destaca por el uso sofisticado de los modelos Claude 3 de Anthropic en la plataforma Amazon Bedrock. Este prototipo pionero tiene la capacidad de extraer y analizar información procedente de documentos complejos en formato PDF, que contienen tanto texto como imágenes, revolucionando así el acceso a la información dentro de la compañía.
El desafío técnico más significativo para Volkswagen fue crear un sistema que permitiera manejar y procesar datos de manera eficiente en un entorno multimodal. Esto debía garantizar tanto la precisión como la accesibilidad de la información almacenada. La solución implementada, basada en la arquitectura de Recuperación de Generación Aumentada (RAG), facilita a Volkswagen un acceso más eficiente a su información interna, optimizando sus operaciones productivas con mayor precisión.
La arquitectura de este sistema se apoya en un backend nativo sin servidor de AWS, optimizado para la eficiencia, escalabilidad y fiabilidad. Integra varios servicios de AWS, como Amazon S3 para el almacenamiento de datos, Amazon Kendra para las búsquedas semánticas, y Amazon Bedrock para el análisis e inferencia de datos. Los modelos de visión de Claude 3 dentro de Amazon Bedrock son vitales para comprender y analizar no solo texto, sino también imágenes, lo cual es crucial para extraer información de documentos complejos.
El flujo de trabajo se inicia cuando un usuario carga un documento PDF utilizando una interfaz web proporcionada por Amazon CloudFront. Tras esto, el documento se almacena en Amazon S3, y Amazon Kendra procede a indexar el texto. Simultáneamente, una función Lambda extrae las imágenes del documento, que son analizadas por Amazon Bedrock para obtener el texto contextual relevante. Todo el texto es almacenado de nuevo en S3 y re-indexado por Amazon Kendra, mejorando así la capacidad de búsqueda del sistema.
Destaca además la capacidad multilingüe del sistema, que gestiona documentos en varios idiomas, incluyendo alemán e inglés, y permite realizar consultas en el idioma de preferencia del usuario. Esta característica es crucial para los usuarios que interactúan con documentos multilingües, mejorando sustancialmente su experiencia al permitir consultas en su idioma nativo.
Los resultados del prototipo han sido asombrosos. Volkswagen ha visto cómo se mejora considerablemente la precisión y relevancia contextual de sus búsquedas semánticas, a la vez que se perfecciona la experiencia del usuario gracias a la integración de capacidades multilingües. Estas características han ampliado significativamente el alcance del sistema entre los usuarios de VW.
Stefan Krawinkel, representante de Volkswagen, ha expresado su satisfacción con los resultados obtenidos, elogiando el espíritu innovador del equipo de AWS y la capacidad de la inteligencia artificial generativa para resolver desafíos complejos y redefinir las fronteras tecnológicas. Esta colaboración no solo ha permitido superar las barreras actuales sino que también ha abierto nuevas posibilidades para futuras innovaciones en el sector automotriz.