NVIDIA y Mistral AI Unen Fuerzas para Impulsar la Inteligencia Distribuida con los Modelos Abiertos Mistral 3

3
minutos de tiempo de lectura
NVIDIA y Mistral AI Unen Fuerzas para Impulsar la Inteligencia

La colaboración entre NVIDIA y la empresa francesa Mistral AI ha dado lugar a una importante innovación en el ámbito de la inteligencia artificial abierta. Ambas compañías han revelado la nueva serie de modelos Mistral 3, que abarca una variedad de modelos multilingües y multimodales de código abierto. Estos modelos han sido optimizados para integrarse perfectamente con la infraestructura de NVIDIA, que abarca desde superclusters como el GB200 NVL72 hasta dispositivos más accesibles como PCs con GPUs RTX y dispositivos Jetson en el edge.

El modelo insignia de esta serie es el Mistral Large 3, un modelo conocido como mixture-of-experts (MoE) que destaca por su eficiencia y escalabilidad. Contrario a los modelos tradicionales que activan todas las neuronas en cada token, el MoE activa solo los “expertos” necesarios, resultando en un menor costo de cómputo sin dejar de lado el rendimiento. Este enfoque busca hacer que la inteligencia artificial a escala empresarial sea no solo posible, sino también económicamente viable.

Con 675.000 millones de parámetros, de los cuales 41.000 millones están activos durante cada inferencia, y una ventana de contexto de 256.000 tokens, el Mistral Large 3 es capaz de manejar tareas complejas de razonamiento, análisis documentales extensos y flujos multimodales complejos. El modelo ha sido diseñado para trabajar en infraestructuras avanzadas como el sistema NVIDIA GB200 NVL72, que es capaz de agrupar 72 GPUs de última generación conectadas por NVLink de alta velocidad.

Gracias a esta combinación de hardware y optimizaciones de software, NVIDIA asegura que el Mistral Large 3 consigue hasta 10 veces más rendimiento de inferencia en comparación con la generación anterior H200. Estas mejoras se traducen en una experiencia de usuario mejorada, costos más bajos por token y una mayor eficiencia energética, aspectos esenciales a medida que el consumo energético en los centros de datos se dispara.

Además, la colaboración no se limita a modelos de gran escala. También se ha presentado la suite Ministral 3, que incluye modelos más compactos de 3.000 a 14.000 millones de parámetros, optimizados para ejecutarse en equipos de menor potencia como PCs y portátiles con GPU GeForce RTX y dispositivos embebidos NVIDIA Jetson. Esto permite que desarrolladores y entusiastas prueben estos modelos en sus propios entornos.

Los modelos Mistral 3 se publican bajo licencia Apache 2.0, asegurando así un enfoque abierto que permite a empresas y desarrolladores acceder, modificar y llevar a producción estos modelos sin las habituales restricciones de los modelos propietarios. Este movimiento busca democratizar el acceso a tecnologías de IA avanzadas, destacando la importancia de un ecosistema abierto.

En la práctica, esto supone que las organizaciones pueden desarrollar arquitecturas de inteligencia distribuida, combinando agentes de alto razonamiento en centros de datos con modelos más pequeños en el edge. Este enfoque no solo reduce la dependencia de la nube, sino que también ofrece mayor privacidad de datos y disminuye el consumo energético, lo que resulta crucial en un contexto global donde la sostenibilidad y la eficiencia son cada vez más relevantes. La alianza entre NVIDIA y Mistral AI representa un avance significativo en el desarrollo de la inteligencia artificial abierta, con potencial para transformar la manera en que las empresas implementan y aprovechan estas tecnologías.

TE PUEDE INTERESAR

NVIDIA y Mistral AI Unen Fuerzas para Impulsar la Inteligencia Distribuida con los Modelos Abiertos Mistral 3 — Andalucía Informa