Optimización de Aplicaciones Generativas en AWS: Integración de RAG con Amazon FSx para NetApp ONTAP y Amazon Bedrock

Las aplicaciones de inteligencia artificial generativa (IA generativa) se están desarrollando con técnicas cada vez más sofisticadas, como la Generación Aumentada por Recuperación (RAG). Este método permite a los modelos base (FMs) acceder a datos adicionales que no estuvieron disponibles durante el entrenamiento inicial. La incorporación de esta información enriquece el contexto de las respuestas generadas por la IA, mejorando tanto la precisión como la transparencia sin tener que reentrenar el modelo continuamente, y minimizando los errores.

En este contexto, se ha presentado una innovadora solución que combina Amazon FSx para NetApp ONTAP con Amazon Bedrock para ofrecer una experiencia RAG en aplicaciones de IA generativa dentro de la plataforma AWS. Esta integración permite traer información no estructurada específica de la empresa a Amazon Bedrock de forma rápida y segura. La clave de esta solución radica en el uso de un sistema de archivos FSx for ONTAP como fuente de datos no estructurados, los cuales se actualizan continuamente en una base de datos vectorial de Amazon OpenSearch Serverless. Esto enriquece los prompts de la IA generativa con datos específicos de la empresa, recuperados de manera eficiente de la base de datos vectorial a través de APIs de Amazon Bedrock.

Uno de los principales desafíos al desarrollar aplicaciones de IA generativa, como chatbots para preguntas y respuestas, es garantizar la seguridad de los datos y evitar consultas a fuentes no autorizadas. Esta solución utiliza FSx for ONTAP para permitir que las empresas extiendan sus mecanismos actuales de seguridad de datos y acceso, aumentando así la fiabilidad de las respuestas generadas por Amazon Bedrock. Al usar FSx for ONTAP como fuente de metadatos, incluyendo configuraciones de listas de control de acceso (ACL) de los usuarios, se asegura que Amazon Bedrock solo utilice datos autorizados, proporcionando un entorno seguro para los usuarios de la aplicación de IA generativa.

Los servicios serverless de AWS juegan un papel crucial en esta solución, facilitando la construcción de aplicaciones de IA generativa con escalabilidad automática, alta disponibilidad y un modelo de facturación basado en el uso. Técnicas como la computación impulsada por eventos con AWS Lambda son ideales para tareas de computación intensiva bajo demanda y para la orquestación flexible de grandes modelos de lenguaje, mientras que Amazon API Gateway ofrece una interfaz API para invocaciones por eventos de los modelos.

La solución admite un sistema de archivos FSx for ONTAP Multi-AZ con una máquina virtual de almacenamiento vinculada a un dominio AWS Managed Microsoft AD. Además, utiliza una colección de búsqueda vectorial en OpenSearch Serverless para proporcionar una capacidad de búsqueda similar de alta performance. Los servidores Amazon Elastic Compute Cloud (Amazon EC2) gestionan el acceso al almacenamiento y las ACLs, mientras que un componente de contenedor de embeddings migra periódicamente archivos y carpetas con sus configuraciones de seguridad a OpenSearch Serverless. La función Lambda para recuperación RAG enriquece los prompts de IA generativa con datos específicos de la empresa y metadatos asociados, recuperados del índice OpenSearch Serverless.

Los usuarios interactúan con la solución enviando un prompt en lenguaje natural a través de una aplicación de chatbot o directamente mediante la interfaz de API Gateway. La aplicación de chatbot, construida en Streamlit y gestionada por un AWS Application Load Balancer (ALB), demuestra accesos basados en permisos mediante ACLs de Windows configuradas para cada documento.

Para implementar esta solución, es necesario clonar el repositorio disponible en GitHub y usar la plantilla Terraform para provisionar todos los componentes con sus configuraciones. El proceso completo puede tardar de 15 a 20 minutos y se puede realizar siguiendo los pasos indicados. Tras finalizar las pruebas, se recomienda limpiar la cuenta AWS eliminando la plantilla Terraform para evitar cargos adicionales.

En resumen, la combinación de FSx for ONTAP y Amazon Bedrock permite construir aplicaciones de IA generativa que responden de manera precisa y segura utilizando datos específicos de la empresa. Los servicios serverless de AWS proporcionan una infraestructura robusta con escalabilidad automática y cómputo impulsado por eventos, ideal para aplicaciones de IA generativa.

Titulares Prensa
Titulares Prensa
Resumen de la actualidad y noticias de la Prensa nacional e internacional

Compartir artículo:

Más popular

Más artículos como este
Relacionados

Visiones del Mañana: La Cumbre de IA Generativa 2025 en Austin y el Futuro de la Innovación

El reciente Generative AI Summit celebrado en Austin, Texas,...

Paciente Muestra Signos de Mejoría, pero Permanece en Estado Crítico

El Papa Francisco ha mostrado una leve mejoría en...

Tragedia en el Deporte: Andrés Pierde la Vida Defendiendo a su Nieto Árbitro de Balonmano

El juzgado ha reclasificado la calificación del delito imputado...