NVIDIA Lanza Nemotron 3 Nano 30B MoE en Amazon SageMaker JumpStart para Potenciar tus Proyectos de IA

3
minutos de tiempo de lectura
Elena Digital López

NVIDIA ha dado un paso significativo en el ámbito de la inteligencia artificial generativa con el lanzamiento de su nuevo modelo, Nemotron 3 Nano 30B. Este avanzado modelo, que incorpora 3 mil millones de parámetros activos, ya está accesible a través de Amazon SageMaker JumpStart, facilitando su integración para empresas y desarrolladores interesados en explotar su potencial.

El Nemotron 3 Nano se distingue por su eficiencia computacional combinada con alta precisión, lo que lo hace ideal para realizar tareas especializadas a gran escala. Su arquitectura innovadora se basa en un modelo de mezcla de expertos (MoE), que cuenta con la integración de una estructura Transformer-Mamba. Este diseño no solo mejora el rendimiento con presupuestos de tokens optimizados, sino que también simplifica la generación de razonamientos complejos.

En el ámbito del desarrollo, NVIDIA ha implementado una política de apertura total con Nemotron 3 Nano. Los pesos, conjuntos de datos y recetas están disponibles públicamente, lo que permite a los desarrolladores personalizar y optimizar su aplicación según las necesidades específicas de cada infraestructura, asegurando al mismo tiempo el cumplimiento de los requisitos de privacidad y seguridad.

Las capacidades del modelo no se limitan a tareas genéricas; se destaca especialmente en codificación, razonamiento científico y resolución de problemas matemáticos complejos. Asimismo, ha liderado benchmarks de referencia, como LiveCodeBench y GPQA Diamond, consolidando su posición como una herramienta poderosa en la creciente demanda de soluciones basadas en inteligencia artificial avanzada. Su capacidad de ventana contextual de hasta un millón de tokens y su funcionamiento basado completamente en texto tanto para entradas como salidas lo hacen versátil y adaptable a diversas aplicaciones.

Para los interesados en aprovechar Nemotron 3 Nano, el procedimiento es sencillo. Un dominio de Amazon SageMaker Studio es el punto de partida, desde donde los usuarios pueden buscar el modelo, desplegarlo y ponerlo a prueba mediante la interfaz de línea de comandos de AWS o el código Python con el SageMaker SDK. Además, su disponibilidad a través de SageMaker JumpStart proporciona una implementación gestionada completa, reduciendo las barreras técnicas para su adopción.

El modelo y la documentación relacionada, junto con ejemplos de código, están disponibles en el repositorio de GitHub de NVIDIA, lo que facilita a los desarrolladores explorar y adoptar esta herramienta avanzada. Con este lanzamiento, NVIDIA reafirma su compromiso con la democratización de la inteligencia artificial generativa, permitiendo que más empresas y desarrolladores adopten tecnología de vanguardia de manera eficiente y efectiva.

TE PUEDE INTERESAR

NVIDIA Lanza Nemotron 3 Nano 30B MoE en Amazon SageMaker JumpStart para Potenciar tus Proyectos de IA — Andalucía Informa