DeepSeek, un laboratorio emergente de inteligencia artificial de China, ha captado la atención del sector al lanzar su innovador modelo R1. Este avance posiciona a DeepSeek como un competidor de peso frente a gigantes como OpenAI y Meta, estableciendo una presencia formidable en el competitivo mercado de la IA, tradicionalmente dominado por Estados Unidos. Con una inversión significativa de aproximadamente 750 millones de dólares, el modelo R1 ha sido comparado favorablemente con los más avanzados de la industria, como GPT y Llama.
Un aspecto clave que ha destacado a DeepSeek es su impresionante infraestructura tecnológica, que incluye un parque de 50,000 GPUs NVIDIA H100. Estas unidades, que utilizan la arquitectura Hopper de NVIDIA, son las más poderosas disponibles actualmente y son esenciales para el entrenamiento del modelo R1. Aunque existen restricciones en la venta de estas GPUs a China, debido a políticas de exportación de Estados Unidos, DeepSeek ha logrado sortearlas, aunque no ha revelado cómo consiguió adquirir estos chips avanzados, generando especulaciones sobre sus métodos.
La verdadera prueba del potencial del R1 se evidenció en la competencia Humanity’s Last Exam, donde modelos de IA debían resolver preguntas complejas en áreas como matemáticas, física, biología y química. El modelo de DeepSeek no solo igualó el rendimiento de gigantes como el GPT-4 de OpenAI, sino que incluso los superó en ciertos aspectos, demostrando así la capacidad de la empresa china para rivalizar y desafiar a los líderes del mercado en un ámbito tan tecnológicamente exigente. Este logro posiciona a DeepSeek como un nuevo contendiente en la carrera por la supremacía de la inteligencia artificial.