Inicio Tecnología NVIDIA Rubin CPX: Revolucionando la Inferencia con Contextos Masivos en la Nueva...

NVIDIA Rubin CPX: Revolucionando la Inferencia con Contextos Masivos en la Nueva Era de la Computación

0

La industria tecnológica sigue avanzando a pasos agigantados con la presentación de NVIDIA de su nueva GPU, Rubin CPX. Esta no se trata solo de una evolución en la línea de productos, sino que marca la creación de una categoría completamente nueva en el ecosistema de procesamiento gráfico CUDA: los procesadores diseñados específicamente para la inferencia en contextos masivos.

Rubin CPX es pionera al permitir que los sistemas de inteligencia artificial manejen ventanas de contexto de hasta un millón de tokens. Este número, que parecía inalcanzable hace un par de años, promete revolucionar áreas clave como la asistencia a la programación y la generación de vídeo multimodal.

La GPU se erige como el primer modelo CUDA capaz de soportar contextos de gran escala, procesando no solo miles de unidades de información, sino millones. Esto abre nuevas posibilidades, como modelos de IA que no solo generen fragmentos de código, sino que puedan comprender proyectos enteros. Además, en el ámbito del vídeo, es capaz de manejar una hora completa de contenido en un solo contexto.

Para garantizar estas capacidades, Rubin CPX incorpora aceleradores de atención de largo alcance, códecs avanzados y un diseño de silicio que prioriza tanto la eficiencia energética como el alto rendimiento. Con un asombroso rendimiento de hasta 30 petaflops en precisión NVFP4 y 128 GB de memoria GDDR7 optimizada en costes, la GPU promete triplicar la capacidad de atención de sus predecesores.

El lanzamiento se da dentro de la plataforma NVIDIA Vera Rubin NVL144 CPX, la cual ofrece una combinación de hardware que alcanza los 8 exaflops de capacidad de IA en un solo rack. Esta plataforma cuenta además con 100 TB de memoria rápida y puede manejar un ancho de banda de memoria de 1,7 petabytes por segundo, lo que representa un impresionante incremento de 7,5 veces respecto a generaciones anteriores.

Jensen Huang, CEO de NVIDIA, comparó la relevancia del lanzamiento de Rubin CPX con otros hitos pasados de la compañía. Resaltó que la nueva GPU demanda una arquitectura completamente nueva, destacando el movimiento del mercado hacia el manejo de contextos de seis o siete cifras.

En cuanto a las implicaciones económicas, NVIDIA estima que los sistemas basados en Rubin CPX podrían generar 5.000 millones de dólares en ingresos por cada 100 millones invertidos en infraestructura. Esto subraya cómo el hardware puede multiplicar directamente el impacto económico de las plataformas de IA.

Antes de su lanzamiento, previsto para finales de 2026, empresas como Cursor, Runway y Magic ya anticipan aprovechar sus capacidades para mejorar sus productos, desde editores de código impulsados por IA hasta herramientas para vídeos generativos.

El ecosistema de software que acompaña a Rubin CPX incluye plataformas como NVIDIA Dynamo, modelos Nemotron y servicios dentro de NVIDIA AI Enterprise, todos diseñados para facilitar la adopción y hacer la transición de prototipos a producción sin complicaciones.

Con Rubin CPX, NVIDIA no solo introduce una nueva pieza de hardware al mercado, sino que lanza una propuesta innovadora que cambia el enfoque del rendimiento basado en FLOPS al rendimiento medido en tokens procesados en contextos inmensos. Este desarrollo establece a la compañía en el centro del debate sobre el futuro de la inteligencia artificial y la inferencia masiva.

Salir de la versión móvil