En la era de la personalización y la atención al cliente, las organizaciones están en una carrera constante para aprovechar su conocimiento exclusivo y su experiencia sectorial, buscando así obtener una ventaja competitiva significativa. La irrupción de los modelos de base (FMs) y sus sobresalientes capacidades de procesamiento del lenguaje natural han abierto nuevas oportunidades para liberar el potencial de sus activos de datos.
A medida que más empresas adoptan la inteligencia artificial generativa, se evidencia la necesidad de ofrecer experiencias personalizadas a sus clientes. Especializar el funcionamiento de los FMs con los datos específicos de la organización y de sus usuarios se convierte en una tarea crucial. En este entorno, la Generación Aumentada por Recuperación (RAG, por sus siglas en inglés) ha emergido como un método efectivo para lograr dicha especialización.
Amazon Bedrock Knowledge Bases ofrece una capacidad completamente gestionada que simplifica la gestión del flujo de trabajo RAG. Este sistema permite a las organizaciones proporcionar información contextual a los FMs y agentes a partir de fuentes de datos privadas, logrando así respuestas más relevantes y precisas que se adaptan a las necesidades específicas de cada cliente.
Para los desarrolladores de productos multiarrendatarios, especialmente los proveedores de software independiente (ISVs) que crean ofertas de software como servicio (SaaS), la capacidad de personalizar experiencias para cada uno de sus clientes es particularmente significativa. La implementación de RAG posibilita el uso selectivo de datos específicos de cada arrendatario, enfrentando desafíos como el aislamiento de datos, la seguridad, la gestión de arrendatarios y la administración de costos.
La arquitectura RAG integrada en las aplicaciones ISV proporciona ejemplos concretos de cómo lograr esta personalización. Un componente crítico de esta arquitectura es el almacenamiento de datos en bases de vectores, actualmente implementado con Amazon OpenSearch Service, aunque la arquitectura puede adaptarse a otras implementaciones similares.
Al diseñar un sistema RAG multiarrendatario, es fundamental considerar el aislamiento de los arrendatarios, la variabilidad, la simplicidad de gestión y la rentabilidad. Estas organizaciones deben equilibrar estos factores para garantizar la efectividad de la solución. Los patrones propuestos: silo, pool y puente, ofrecen distintos niveles de aislamiento y personalización, adaptándose a diferentes necesidades y casos de uso.
El patrón de silo se destaca por su nivel de aislamiento, implementando una infraestructura completamente separada para cada arrendatario. A pesar de ser más costoso, brinda la máxima independencia arquitectónica y seguridad de datos. En contraste, el patrón de pool, que comparte la arquitectura RAG entre todos los arrendatarios, optimiza costos pero limita la personalización específica de cada arrendatario. Finalmente, el patrón de puente encuentra un equilibrio entre los dos primeros, facilitando la personalización y ofreciendo una mayor optimización de costos en comparación con el patrón de silo.
Estos enfoques permiten a las organizaciones adaptar su arquitectura tecnológica, logrando ofrecer un servicio cada vez más personalizado, asegurando así la satisfacción del cliente y maximizando el aprovechamiento de sus recursos y datos disponibles.