Amazon ha dado un paso significativo en el campo de la inteligencia artificial con el lanzamiento de su sistema SageMaker HyperPod. Esta innovación permite a las organizaciones beneficiarse del poder de las GPUs NVIDIA Blackwell dentro de un único sistema, lo que podría definir la próxima generación de avances en inteligencia artificial.
El sistema ofrece un impresionante rendimiento de 360 petaflops en cálculos de punto flotante denso (FP8) y 1.4 exaflops en cálculos de punto flotante disperso (FP4). Esta capacidad promete revolucionar el entrenamiento y la implementación de modelos de inteligencia artificial de gran escala.
Los nuevos P6e-GB200 UltraServers, que integran la arquitectura NVIDIA GB200 NVL72, proporcionan un rendimiento sin precedentes para manejar modelos de inteligencia artificial que alcanzan los mil billones de parámetros. La combinación perfecta de estos servidores con el entorno distribuido de SageMaker HyperPod permite a las empresas escalar rápidamente el desarrollo de modelos, minimizando el tiempo de inactividad y facilitando la transición a un despliegue masivo.
Con una configuración que une 36 CPUs NVIDIA Grace y 72 GPUs Blackwell en un dominio NVLink único, los UltraServers son capaces de ofrecer un acceso sin igual a los recursos de computación. Esto se traduce en una mejora notable en el rendimiento y la eficiencia durante la formación de modelos de inteligencia artificial.
La solución sobresale también en capacidad de red, proporcionando un ancho de banda NVLink de baja latencia de hasta 130 TBps entre las GPUs, lo cual es crucial para mejorar la comunicación en cargas de trabajo a gran escala. Además, sus 405 TB de almacenamiento NVMe SSD local optimizan el proceso de entrenamiento, permitiendo un acceso rápido a los datos.
Esta iniciativa representa un avance crucial hacia un entrenamiento y despliegue de modelos más rápido y eficiente, especialmente útil para organizaciones que manejan múltiples proyectos de inteligencia artificial. La infraestructura también asegura una maximización de recursos y una reducción de costos operativos.
Los interesados pueden acceder a estas capacidades avanzadas a través de planes de entrenamiento flexibles disponibles en la zona local de AWS en Dallas, abriendo las puertas al desarrollo de inteligencia artificial en diversos sectores. Las organizaciones tienen la posibilidad de registrarse en la consola de SageMaker para empezar a aprovechar esta tecnología de vanguardia.