Optimización de Aplicaciones Generativas en AWS: Integración de RAG con Amazon FSx para NetApp ONTAP y Amazon Bedrock

Las aplicaciones de inteligencia artificial generativa (IA generativa) se están desarrollando con técnicas cada vez más sofisticadas, como la Generación Aumentada por Recuperación (RAG). Este método permite a los modelos base (FMs) acceder a datos adicionales que no estuvieron disponibles durante el entrenamiento inicial. La incorporación de esta información enriquece el contexto de las respuestas generadas por la IA, mejorando tanto la precisión como la transparencia sin tener que reentrenar el modelo continuamente, y minimizando los errores.

En este contexto, se ha presentado una innovadora solución que combina Amazon FSx para NetApp ONTAP con Amazon Bedrock para ofrecer una experiencia RAG en aplicaciones de IA generativa dentro de la plataforma AWS. Esta integración permite traer información no estructurada específica de la empresa a Amazon Bedrock de forma rápida y segura. La clave de esta solución radica en el uso de un sistema de archivos FSx for ONTAP como fuente de datos no estructurados, los cuales se actualizan continuamente en una base de datos vectorial de Amazon OpenSearch Serverless. Esto enriquece los prompts de la IA generativa con datos específicos de la empresa, recuperados de manera eficiente de la base de datos vectorial a través de APIs de Amazon Bedrock.

Uno de los principales desafíos al desarrollar aplicaciones de IA generativa, como chatbots para preguntas y respuestas, es garantizar la seguridad de los datos y evitar consultas a fuentes no autorizadas. Esta solución utiliza FSx for ONTAP para permitir que las empresas extiendan sus mecanismos actuales de seguridad de datos y acceso, aumentando así la fiabilidad de las respuestas generadas por Amazon Bedrock. Al usar FSx for ONTAP como fuente de metadatos, incluyendo configuraciones de listas de control de acceso (ACL) de los usuarios, se asegura que Amazon Bedrock solo utilice datos autorizados, proporcionando un entorno seguro para los usuarios de la aplicación de IA generativa.

Los servicios serverless de AWS juegan un papel crucial en esta solución, facilitando la construcción de aplicaciones de IA generativa con escalabilidad automática, alta disponibilidad y un modelo de facturación basado en el uso. Técnicas como la computación impulsada por eventos con AWS Lambda son ideales para tareas de computación intensiva bajo demanda y para la orquestación flexible de grandes modelos de lenguaje, mientras que Amazon API Gateway ofrece una interfaz API para invocaciones por eventos de los modelos.

La solución admite un sistema de archivos FSx for ONTAP Multi-AZ con una máquina virtual de almacenamiento vinculada a un dominio AWS Managed Microsoft AD. Además, utiliza una colección de búsqueda vectorial en OpenSearch Serverless para proporcionar una capacidad de búsqueda similar de alta performance. Los servidores Amazon Elastic Compute Cloud (Amazon EC2) gestionan el acceso al almacenamiento y las ACLs, mientras que un componente de contenedor de embeddings migra periódicamente archivos y carpetas con sus configuraciones de seguridad a OpenSearch Serverless. La función Lambda para recuperación RAG enriquece los prompts de IA generativa con datos específicos de la empresa y metadatos asociados, recuperados del índice OpenSearch Serverless.

Los usuarios interactúan con la solución enviando un prompt en lenguaje natural a través de una aplicación de chatbot o directamente mediante la interfaz de API Gateway. La aplicación de chatbot, construida en Streamlit y gestionada por un AWS Application Load Balancer (ALB), demuestra accesos basados en permisos mediante ACLs de Windows configuradas para cada documento.

Para implementar esta solución, es necesario clonar el repositorio disponible en GitHub y usar la plantilla Terraform para provisionar todos los componentes con sus configuraciones. El proceso completo puede tardar de 15 a 20 minutos y se puede realizar siguiendo los pasos indicados. Tras finalizar las pruebas, se recomienda limpiar la cuenta AWS eliminando la plantilla Terraform para evitar cargos adicionales.

En resumen, la combinación de FSx for ONTAP y Amazon Bedrock permite construir aplicaciones de IA generativa que responden de manera precisa y segura utilizando datos específicos de la empresa. Los servicios serverless de AWS proporcionan una infraestructura robusta con escalabilidad automática y cómputo impulsado por eventos, ideal para aplicaciones de IA generativa.

Optimización de Aplicaciones Generativas en AWS: Integración de RAG con Amazon FSx para NetApp ONTAP y Amazon Bedrock

TE PUEDE INTERESAR

Revolución Energética: xAI Implementa Baterías Tesla para Superar Desafíos Energéticos en la Era de la IA

Introducción a la Innovadora Transmisión Bidireccional para Inferencia en Tiempo Real en Amazon SageMaker AI

Inauguración del Centro de Datos de 45 MW en Virginia por Penzance y AWS: Impulso a la Infraestructura Digital y Espacios Verdes Comunitarios

Warner Bros. Discovery Optimiza Eficiencia y Reduce Costos en un 60% con AWS Graviton y Machine Learning Acelerado

LO MÁS POPULAR

Visita de Mariola Rus y Tania Barcelona al CEEDA – Federación Andaluza de Vela

Los Chicos Sub16 de Unicaja Jaén Paraíso Interior se Coronan Campeones de España de Campo a Través en Atapuerca – FAA

Juan José García Ramírez y Antonio Atienza Destacan en la 5ª Cronometrada de Zahara