NVIDIA Rubin: Innovación en Chips para Potenciar y Democratizar la IA de Razonamiento

4
minutos de tiempo de lectura
NVIDIA Rubin Innovacion en Chips para Potenciar y Democratizar la

En el marco del CES en Las Vegas, NVIDIA ha lanzado Rubin, su nueva plataforma de computación orientada a potenciar aplicaciones de inteligencia artificial. Bautizada en honor a la astrónoma Vera Florence Cooper Rubin, esta plataforma se presenta como una solución a la creciente demanda de capacidades de cómputo para entrenar y ejecutar modelos avanzados de IA, cuyo costo de producción ha estado en constante aumento. NVIDIA propone así una arquitectura integral compuesta por seis chips que, en conjunto, funcionan como un superordenador especializado en IA.

El corazón de la plataforma Rubin es lo que NVIDIA llama el «códiseño extremo», donde CPU, GPU, red, seguridad, operaciones y almacenamiento se desarrollan de manera coordinada para eliminar cuellos de botella tradicionales. Este sistema incluye componentes como la CPU NVIDIA Vera, la GPU NVIDIA Rubin y el switch NVLink 6, todos combinados para reducir el tiempo de entrenamiento y, significativamente, el costo por token en procesos de inferencia.

La estrategia de NVIDIA busca dejar atrás el enfoque tradicional centrado únicamente en GPU, introduciendo el concepto de la «fábrica de IA». Este nuevo paradigma incorpora no solo los aceleradores de hardware, sino también consideraciones de seguridad de datos, eficiencia energética y resiliencia del sistema. Jensen Huang, fundador y CEO de NVIDIA, ha subrayado la importancia de este lanzamiento, destacando su pertinencia en un momento en que el sector está listo para dar un salto hacia «la próxima frontera» de la inteligencia artificial.

Rubin promete ofrecer hasta diez veces menos costo por token en comparación con su predecesor Blackwell y la capacidad de entrenar modelos Mixture-of-Experts (MoE) usando cuatro veces menos GPUs. Este avance está orientado a tareas cada vez más comunes en laboratorios y grandes plataformas, como razonamiento en múltiples pasos, memoria extendida y generación masiva de videos.

La plataforma Rubin se comercializa en dos formatos: NVL72 y HGX NVL8. El primero es un sistema integrado que incluye 72 GPUs y 36 CPUs diseñado para un uso intensivo a escala de racks, mientras que el segundo es una opción de servidor con 8 GPUs, orientado a entornos basados en x86.

NVIDIA también introduce cinco innovaciones clave en la plataforma Rubin: desde un NVLink de sexta generación que ofrece un ancho de banda notablemente superior, hasta la introducción de un CPU NVIDIA Vera eficiente y un GPU Rubin mejorado con un Transformer Engine de tercera generación. Además, la plataforma es pionera en la implementación de un sistema de Computación Confidencial y un motor RAS de segunda generación para mejorar el mantenimiento y la seguridad.

Un aspecto crítico que Rubin aborda es el contexto de inferencia, un recurso vital en modelos de IA modernos. La plataforma Inference Context Memory Storage de NVIDIA está diseñada para escalar este factor, optimizando la capacidad de respuesta y el rendimiento compartiendo este estado entre diferentes infraestructuras.

La red, otro elemento crucial, se potencia con el nuevo Ethernet Spectrum-6, que busca minimizar limitaciones en conectividad y maximizar la eficiencia. Esta innovación permite que centros de datos físicamente distantes funcionen como un único entorno lógico.

NVIDIA ve en el DGX SuperPOD el diseño de referencia para escalar Rubin, con capacidades de unificación y rendimiento que prometen reducir la necesidad de fragmentar modelos durante su ejecución. Este diseño estará disponible a través de socios clave en la nube a partir de la segunda mitad de 2026, con instituciones como AWS, Google Cloud, y Microsoft preparándose para implementar esta tecnología.

En resumen, Rubin no solo promete mejorar el rendimiento y reducir costos en aplicaciones de inteligencia artificial, sino que redefine el enfoque de infraestructura, abriendo un camino hacia soluciones más integrales y eficientes en un mercado cada vez más competitivo y exigente.

TE PUEDE INTERESAR

NVIDIA Rubin: Innovación en Chips para Potenciar y Democratizar la IA de Razonamiento — Andalucía Informa