NVIDIA Impulsa el Avance Local de Modelos con Unsloth, Nemotron 3 y la Potencia de DGX Spark

3
minutos de tiempo de lectura
NVIDIA Impulsa el Avance Local de Modelos con Unsloth Nemotron

NVIDIA se ha propuesto acercar el ajuste fino de modelos de lenguaje a los desarrolladores de a pie mediante la introducción de herramientas que permiten realizar esta tarea desde PCs equipados con GeForce RTX, estaciones RTX PRO y sistemas compactos del tipo «mini supercomputador». La empresa ha presentado su nuevo framework de código abierto, Unsloth, diseñado para facilitar entrenamientos eficientes y con un menor consumo de memoria. Este movimiento está respaldado por las nuevas incorporaciones a su ecosistema, la familia NVIDIA Nemotron 3 y el sistema DGX Spark.

El ajuste fino ya no es un ámbito exclusivo de laboratorios de I+D. NVIDIA busca hacer de esta técnica un proceso natural en el desarrollo de asistentes y agentes inteligentes, procurando que no solo sean capaces de ejecutar tareas sino también de responder de manera acertada y especializada a contextos específicos. Esto implica ajustar el comportamiento, el formato y los conocimientos de dominio de los modelos.

Unsloth ofrece un desempeño hasta 2,5 veces más rápido en GPUs de NVIDIA con Hugging Face Transformers y ayuda a reducir el consumo de VRAM, facilitando así la experimentación en equipos de escritorio convencionales. Este framework se apoya en tres métodos principales de ajuste fino: el ajuste eficiente en parámetros (LoRA/QLoRA), el ajuste completo, y el aprendizaje por refuerzo, cada uno adaptado a distintos requerimientos en términos de presupuesto, tiempo y complejidad.

Por su parte, los modelos NVIDIA Nemotron 3 están pensados para facilitar el desarrollo de aplicaciones con agentes que requieren manejar contextos largos y complejos. Destaca el modelo Nemotron 3 Nano 30B-A3B, diseñado para abaratar costos de inferencia y manejar ventanas de contexto extensas, con la promesa de reducir hasta un 60% los reasonings tokens y manejar un millón de tokens en tareas multietapa.

El tercer componente, el sistema DGX Spark, se presenta como una opción potente para los desarrolladores que deseen prototipar, ajustar y ejecutar modelos localmente sin las limitaciones típicas del cloud. Equipada con un GB10 Grace Blackwell Superchip y 128 GB de memoria, esta máquina promete soportar incluso modelos de hasta 200 mil millones de parámetros, resaltando su capacidad para manejar tareas creativas y multimodales completas desde un entorno local.

En conjunto, estos desarrollos de NVIDIA no solo ofrecen nuevas herramientas y capacidades a los desarrolladores, sino que también reflejan un cambio cultural significativo en la forma de abordar el ajuste fino: lo que era un proyecto de laboratorio se ha convertido en una fase integral del ciclo de vida de agentes inteligentes, simplificando el camino para que cualquier desarrollador pueda descargar, ajustar y desplegar modelos desde su escritorio.

TE PUEDE INTERESAR

NVIDIA Impulsa el Avance Local de Modelos con Unsloth, Nemotron 3 y la Potencia de DGX Spark — Andalucía Informa