El reciente informe de Morgan Stanley Research ha arrojado luz sobre el negocio de la IA de inferencia, confirmando lo que muchos ya sospechaban: NVIDIA se encuentra en una posición privilegiada. No solo domina en términos de potencia de hardware, sino que también lidera la rentabilidad del negocio.
Basándose en un modelo estandarizado que simula una “fábrica de inferencia de IA” de 100 MW, el estudio evalúa el costo total de propiedad y los ingresos generados por los modelos de lenguaje y aplicaciones de IA. Los resultados son impactantes, con un promedio global de más del 50 % de margen operativo, demostrando que la inferencia es uno de los sectores más lucrativos de la economía digital.
NVIDIA supera a sus competidores con su plataforma GB200 NVL72 Blackwell, que ofrece un margen impresionante del 77,6 % y beneficios de 3.500 millones de dólares. Este éxito se debe no solo a la potencia de su hardware, sino también a la solidez del ecosistema CUDA y las optimizaciones en soporte a FP4, que maximizan la eficiencia energética.
Aunque Google y AWS siguen de cerca, con márgenes del 74,9 % y 62,5 % respectivamente, NVIDIA mantiene su liderazgo. Huawei también se muestra como un competidor fuerte con su plataforma CloudMatrix 384, aunque el gran desafío recae sobre AMD. Con márgenes negativos significativos en sus plataformas MI355X y MI300X, AMD necesita mejorar su ecosistema de software para competir eficazmente.
El informe destaca que la inferencia representará el 85 % del mercado de la IA próximamente, asegurando la importancia del liderazgo de NVIDIA. La empresa ya mira al futuro con su próxima arquitectura Rubin, programada para 2026.
Mientras que Google y AWS demuestran que los proveedores con hardware propio pueden ser competitivos, AMD enfrenta un desafío considerable: mejorar su software para cerrar la brecha con NVIDIA y ofrecer una alternativa viable en el competitivo mundo de la inferencia de IA.