Inicio Tecnología Oracle lanza OCI Zettascale10: El poder de la IA en la nube...

Oracle lanza OCI Zettascale10: El poder de la IA en la nube con 16 zettaFLOPS y 800,000 GPUs por clúster

0

Oracle ha presentado su nueva generación de «superordenadores» de inteligencia artificial en la nube, conocida como Oracle Cloud Infrastructure (OCI) Zettascale10. Estos clústeres están diseñados para conectar cientos de miles de GPUs NVIDIA distribuidas en varios centros de datos, ofreciendo una capacidad multigigavatio y logrando picos de rendimiento teórico de hasta 16 zettaFLOPS. El desarrollo se enmarca en una colaboración con OpenAI bajo el programa Stargate, en Abilene, Texas.

El pilar fundamental de esta innovadora infraestructura es la red Oracle Acceleron RoCE (RoCEv2), que promete baja latencia GPU-GPU, escalabilidad masiva, eficiencia de costo/rendimiento y alta fiabilidad para entrenamientos e inferencias a gran escala. Según Mahesh Thiagarajan, EVP de Oracle Cloud Infrastructure, esta arquitectura busca fusionar una capacidad multigigavatio sin precedentes con la infraestructura de IA de NVIDIA.

Zettascale10 es capaz de desplegar hasta 16 zettaFLOPS de rendimiento pico en macro-campus densamente diseñados para reducir latencias y mejorar la eficiencia en el uso de clústeres. Su colaboración estratégica con OpenAI permitió el desarrollo inicial de esta tecnología en el superclúster Stargate. Oracle también garantiza controles de soberanía de datos para sus usuarios.

El diseño subyacente de la red es amplio, poco profundo y resiliente. Utiliza una arquitectura que reduce niveles de la red, mejorar el rendimiento de costos y mantener la consistencia del rendimiento general. Esto se logra mediante la inserción de una GPU NIC que actúa como un mini-switch, conectándose a varios planos físicos y lógicos aislados.

Oracle ha abierto desde hoy las órdenes para OCI Zettascale10, con disponibilidad prevista para la segunda mitad del próximo año. Este nuevo desarrollo está dirigido a entrenar modelos fundacionales de gran tamaño, así como para tareas de serving e inferencias de alto rendimiento.

En el contexto actual, donde la industria avanza hacia campos de datos a escala gigavatio, el enfoque de Oracle, que combina la infraestructura de macro-campus con un diseño de red multiestrato, pretende establecer un nuevo estándar en el procesamiento masivo de datos.

Faltan por conocer ciertos detalles, como el mix exacto de GPUs que se utilizarán, las métricas de escala real en producción y las políticas específicas de acceso y eficiencia energética. A pesar de estas incógnitas, se prevé que OCI Zettascale10 posicione a Oracle de manera competitiva en la carrera para la industrialización de la IA.

Salir de la versión móvil