Uno de los usos más relevantes de la inteligencia artificial generativa (IA) y los grandes modelos de lenguaje (LLMs) en el ámbito empresarial es la capacidad de responder preguntas basadas en el corpus de conocimiento interno de la empresa. Los modelos de fundación preentrenados (FMs) destacan en tareas de comprensión del lenguaje natural (NLU), como la generación de resúmenes, la producción de texto y la respuesta a preguntas sobre una amplia variedad de temas. Sin embargo, enfrentan retos significativos. Entre ellos, la propensión a dar respuestas imprecisas o «alucinaciones» cuando no tienen la información adecuada en su entrenamiento y su incapacidad para manejar datos recientes en tiempo real, lo que podría desembocar en respuestas incorrectas o desactualizadas.
Las empresas deben abordar un desafío crítico al trabajar con datos: superar la desconexión entre el lenguaje natural, que puede ser ambiguo e impreciso, y los datos estructurados, que siguen esquemas rígidos. Por ejemplo, las consultas SQL pueden resultar complejas e intuitivas para usuarios sin habilidades técnicas específicas. La interpretación de consultas complejas, que impliquen múltiples tablas, uniones y agregaciones, complica la comprensión de la intención del usuario y su correcta traducción en operaciones SQL. La terminología especializada y las variaciones lingüísticas también presentan desafíos añadidos. La ambigüedad inherente del lenguaje natural puede llevar a múltiples interpretaciones de una sola consulta, dificultando la comprensión precisa de la intención del usuario.
Para superar estas barreras, se requiere un procesamiento avanzado del lenguaje natural (NLP) que alinee las consultas de los usuarios con el esquema de la base de datos, tablas y operaciones. En este contexto, Amazon Q Business emerge como un intermediario eficiente, capaz de traducir el lenguaje natural en consultas SQL precisas. Los usuarios pueden realizar preguntas tan simples como «¿Cuáles fueron las ventas de equipo para exteriores en el tercer trimestre de 2023?», y Amazon Q Business se encarga de analizar la intención, acceder a las fuentes de datos y generar la consulta SQL. Esto no solo facilita el acceso a los datos para los usuarios no técnicos, sino que también optimiza los flujos de trabajo para los profesionales, permitiéndoles enfocarse en tareas de mayor valor.
En este artículo, se presenta una arquitectura para consultar datos estructurados utilizando Amazon Q Business y una aplicación para consultar datos de costos y uso en Amazon Athena. Amazon Q Business puede crear consultas SQL a fuentes de datos dadas cuando se le proporciona el esquema de la base de datos, metadatos adicionales que describen las columnas y tablas, e instrucciones detalladas. Esta arquitectura puede adaptarse para incluir fuentes de datos adicionales, validación de consultas y métodos avanzados para cubrir una gama más amplia de casos de uso.
La siguiente figura representa la arquitectura de alto nivel de la solución propuesta. Los pasos 3 y 4 amplían la integración del Centro de Identidad IAM de AWS con Amazon Q Business para un flujo de autorización. En esta arquitectura, Amazon Cognito se utiliza para la autenticación de usuarios y un emisor de tokens de confianza para el Centro de Identidad IAM. También es posible emplear un proveedor de identidad propio como emisor de tokens confiable, siempre que sea compatible con OpenID Connect (OIDC).
El flujo de trabajo sigue los siguientes pasos:
1. El usuario inicia la interacción con la aplicación Streamlit, accesible a través de un Balanceador de Carga de Aplicación, que actúa como punto de entrada.
2. La aplicación solicita al usuario autenticarse utilizando sus credenciales de Amazon Cognito, asegurando un acceso seguro.
3. La aplicación intercambia el token obtenido de Amazon Cognito por un token del Centro de Identidad IAM, otorgando el alcance necesario para interactuar con Amazon Q Business.
4. Utilizando el token del Centro de Identidad IAM, la aplicación asume un rol de Administración y Gestión de Identidades (IAM) de AWS y obtiene una sesión de AWS desde el Servicio de Seguridad de Tokens de AWS (AWS STS), habilitando la comunicación autorizada con Amazon Q Business.
5. Basado en la consulta en lenguaje natural del usuario, la aplicación formula los avisos y metadatos relevantes, que luego son enviados a la API chat_sync
de Amazon Q Business. En respuesta, Amazon Q Business proporciona una consulta Athena adecuada para ejecutar.
6. La aplicación ejecuta la consulta Athena recibida de Amazon Q Business y los datos resultantes se muestran en la interfaz de usuario de la aplicación web.
En conclusión, Amazon Q Business tiene la capacidad de utilizar LLM directamente para generar respuestas adecuadas, mediante modos de chat como CREATOR_MODE
. Esto permite omitir la generación de recuperación aumentada (RAG) y utilizar texto directo en la ventana de contexto para generar respuestas. Esta capacidad facilita que los usuarios empresariales accedan y analicen datos estructurados de manera efectiva, promoviendo una toma de decisiones basada en datos, la innovación y nuevas oportunidades para crecimiento y éxito empresarial.