La inteligencia artificial sigue marcando el ritmo de la innovación tecnológica, y los PCs Copilot+ han emergido como actores principales en esta evolución. Con la integración de los modelos DeepSeek R1, desarrollados por Running Distilled, se potencia la capacidad de estos dispositivos, permitiendo a los usuarios experimentar con IA avanzada directamente desde su computadora personal.
El lanzamiento de DeepSeek R1 en Azure AI Foundry incluye versiones optimizadas para unidades de procesamiento neural (NPU), comenzando con el modelo DeepSeek-R1-Distill-Qwen-1.5B. Este enfoque inicial se centra en el Qualcomm Snapdragon X, con futuros lanzamientos planificados para el Intel Core Ultra 200V, entre otros. Esta disponibilidad a través del AI Toolkit transforma la manera en que los desarrolladores crean aplicaciones, permitiéndoles aprovechar las capacidades de las NPUs para implementar soluciones de IA que operan eficientemente en el mismo dispositivo.
El avance no se detiene en la mera presencia de DeepSeek en PCs locales; la arquitectura detrás de estos modelos ha sido refinada para asegurar un funcionamiento semi-continuo, liberando servicios de IA con un rendimiento sobresaliente. Las optimizaciones realizadas en Phi Silica han sido claves para este logro, centrando esfuerzos en inferencia rápida y efectiva, reduciendo el uso de batería y recursos del sistema.
La extensión AI Toolkit para Visual Studio Code ya está disponible para desarrolladores que deseen explorar las capacidades de DeepSeek. Esto ofrece la oportunidad de interactuar con una biblioteca de modelos optimizados en el formato ONNX QDQ, facilitando testear su rendimiento en el entorno local. Alternativamente, los modelos también pueden examinarse desde la nube a través de Azure Foundry.
Las optimizaciones de silicio implementadas en el modelo Qwen 1.5B demuestran un enfoque en la eficiencia y la velocidad. Al integrar un tokenizador, una capa de incrustación y un sofisticado modelo de procesamiento de contexto, logra un tiempo de respuesta de 130 milisegundos y una producción de 16 tokens por segundo en respuestas cortas. Esto se logra mediante un diseño de ventana deslizante y un innovador esquema de cuantización que mejora notablemente la precisión.
Los avances introducidos con los modelos DeepSeek R1 prometen redefinir la interacción con la IA en dispositivos personales. Este salto tecnológico permite que la inteligencia artificial no solo sea accesible, sino también extremadamente eficiente, dando pie a una nueva generación de aplicaciones inteligentes que operan con independencia del poder computacional de la nube.