NVIDIA ha lanzado una novedosa herramienta que promete revolucionar el ámbito de la inteligencia artificial generativa. Se trata del NeMo Retriever Llama 3.2, ahora disponible en Amazon SageMaker JumpStart, un avance significativo que permite a los desarrolladores integrar modelos optimizados de re-ranking y text embedding de manera más sencilla y eficiente. Estos microservicios de NVIDIA NIM prometen facilitar la construcción, experimentación y escalado de innovaciones en inteligencia artificial dentro de la plataforma AWS.
Los microservicios ofrecidos por NVIDIA están diseñados para una integración fluida con servicios gestionados de AWS, como Amazon EC2, Amazon EKS y Amazon SageMaker. Esta nueva oferta simplifica el despliegue de modelos de inteligencia artificial a gran escala, apoyando desde modelos de código abierto hasta los modelos base exclusivos de NVIDIA. Con el uso de API estándar de la industria, los desarrolladores pueden incorporar estas herramientas en sus aplicaciones usando apenas unas líneas de código o mediante la interfaz de SageMaker JumpStart.
El NeMo Retriever text embedding se destaca por su capacidad para manejar recuperación de información en múltiples idiomas y contextos, y es capaz de lidiar con documentos largos de hasta 8,192 tokens. Evaluado en 26 idiomas, este modelo no solo mejora la eficiencia de recuperación de datos, sino que también logra una significativa reducción en el consumo de almacenamiento.
Asimismo, el NeMo Retriever text reranking está diseñado para proporcionar una puntuación de relevancia más precisa para consultas específicas mediante el manejo de documentos extensos. Su enfoque multilingüe y capacidad para integrar textos largos lo posicionan como una herramienta invaluable para sistemas de búsqueda empresarial y aplicaciones de atención al cliente.
SageMaker JumpStart ofrece un entorno completamente gestionado que admite el uso de modelos de lenguaje avanzados en diversas aplicaciones, desde generación de contenido y código hasta respuesta a preguntas. Además, características como Amazon SageMaker Pipelines y Debugger optimizan el rendimiento y brindan mayor control sobre las operaciones de aprendizaje automático.
Los nuevos microservicios de NeMo Retriever están disponibles a través del SDK de Python de Amazon SageMaker, permitiendo a los desarrolladores aprovechar avanzadas características de MLOps y asegurando el rendimiento del modelo en un entorno protegido. La gestión de datos en una nube privada virtual (VPC) refuerza la seguridad, alineándose con los estrictos requisitos de las empresas.
Con esta innovadora oferta, NVIDIA y AWS consolidan su posición como líderes proporcionando soluciones avanzadas que capacitan a las empresas para implementar capacidades de búsqueda sin perder eficiencia ni diversidad lingüística, garantizando aplicaciones de IA accesibles a una audiencia global de manera ágil y precisa.