Optimización de Flujos de Trabajo: Integración de OpenAI GPT OSS con Amazon SageMaker AI y Bedrock AgentCore

OpenAI ha introducido dos modelos innovadores de pesos abiertos, el gpt-oss-120b y el gpt-oss-20b, con 117 mil millones y 21 mil millones de parámetros, respectivamente. Estos modelos, diseñados con un enfoque de Mezcla de Expertos (MoE) y una generosa ventana de contexto de 128K, se han posicionado como líderes en el ámbito de los modelos de código abierto, destacando particularmente en tareas de razonamiento y dinámicas de flujo de trabajo, según evidencian los benchmarks de Artificial Analysis.

Los usuarios de Amazon SageMaker AI cuentan ahora con la capacidad de personalizar y perfeccionar estos modelos para adaptarlos a sus necesidades específicas, desplegándolos de acuerdo con sus preferencias a través de un servicio totalmente gestionado. SageMaker Inference ofrece la flexibilidad requerida para integrar el propio código de inferencia sin la necesidad de construir o mantener clústeres complejos.

Aunque los grandes modelos de lenguaje (LLMs) sobresalen en la comprensión del lenguaje y la generación de contenido, el desarrollo de aplicaciones autónomas en el mundo real demanda una sofisticada gestión de flujos de trabajo, herramientas de integración y capacidad para manejar el contexto. Las arquitecturas basadas en múltiples agentes abordan parte de estos desafíos, al descomponer sistemas complejos en componentes especializados, pero también introducen dificultades adicionales en la colaboración y orquestación de dichos agentes.

En reciente información compartida, se describen los pasos para desplegar el modelo gpt-oss-20b en los endpoints gestionados de SageMaker, ilustrando con un ejemplo práctico un asistente analizador de acciones utilizando LangGraph, un marco avanzado basado en gráficos para gestionar estados y flujos de trabajo de manera coordinada. Posteriormente, los agentes se implantarán en Amazon Bedrock AgentCore, una capa unificada de orquestación que abstrae la infraestructura, facilitando así la operación segura y escalable de agentes de IA.

La solución propuesta incluye un analizador de acciones compuesto por el modelo GPT OSS 20B, desplegado en un endpoint de SageMaker mediante vLLM; LangGraph para la construcción de un entorno de orquestación de múltiples agentes; y Amazon Bedrock AgentCore para el despliegue definitivo. Esta arquitectura permite que los usuarios realicen consultas que serán procesadas por una serie de agentes especializados en evaluar acciones.

El proceso también guía a los usuarios sobre cómo configurar sus entornos, gestionar permisos y realizar despliegues de manera eficiente, destacando herramientas como vLLM y Amazon Elastic Container Registry para un hospedaje óptimo. Esto no solo reduce el tiempo necesario para el análisis de acciones sino que también incrementa la productividad al automatizar tareas rutinarias, liberando recursos para enfoques más complejos y estratégicos.

Se anima a los usuarios a explorar ejemplos de código y mejorar flujos de trabajo de agentes para adaptarlos a diferentes escenarios, subrayando el potencial transformador de los modelos de código abierto en la optimización y eficiencia de procesos empresariales.

Titulares Prensa
Titulares Prensa
Resumen de la actualidad y noticias de la Prensa nacional e internacional

Compartir artículo:

Más popular

Más artículos como este
Relacionados

TruMerit: Potenciando el Reconocimiento Global de Credenciales en Rehabilitación

TruMerit ha dado un paso significativo en el ámbito...

Actualizaciones Innovadoras para Paint, Snipping Tool y Notepad: Disponibles para Windows Insiders

Microsoft ha comenzado a implementar nuevas actualizaciones para varias...

Vibrante Duelo en Anfield: Liverpool vs Atlético de Madrid en Directo

El enfrentamiento entre Liverpool y Atlético de Madrid en...