Los modelos de lenguaje grandes han revolucionado diversas industrias gracias a su capacidad para realizar múltiples tareas generales. No obstante, cuando se trata de aplicaciones específicas que requieren una comprensión profunda y terminología sectorial precisa, estos modelos enfrentan desafíos significativos. Uno de los métodos para adaptarlos a contextos empresariales es el fine-tuning supervisado (SFT), el cual permite ajustar modelos para que sean más eficientes en tareas especializadas.
En este proceso, el ajuste de parámetros eficientes (PEFT) se destaca por actualizar solo una parte del modelo, haciendo el entrenamiento más rápido y económico. Por otro lado, el SFT de rango completo permite una adaptación más amplia debido a la actualización de todos los parámetros, aunque enfrenta el problema del «olvido catastrófico». Este fenómeno ocurre cuando el modelo, al adaptarse demasiado a un dominio específico, pierde eficacia en tareas generales como el razonamiento y la comprensión de instrucciones.
Para superar esta limitación, Amazon ha lanzado Nova Forge, un servicio que promete una solución innovadora. Nova Forge permite a las organizaciones crear modelos especializados desde puntos de control, mezclando sus propios datos con los entrenados por Amazon Nova. Esta estrategia no solo ofrece personalización, sino también garantiza que los modelos conserven habilidades generales, gracias a su implementación en AWS.
Investigadores de AWS China han testeado Nova Forge con una tarea compleja de clasificación de comentarios de clientes, enfrentándolo a modelos de código abierto. Con más de 16,000 comentarios y una jerarquía de 1,420 categorías, Nova Forge demostró mejorar en un 17% el rendimiento en tareas específicas del dominio y conservar su capacidad general representada en las puntuaciones MMLU.
En la práctica, las grandes empresas de comercio electrónico podrían beneficiarse enormemente. Para mejorar el servicio al cliente, necesitan modelos que clasifiquen automáticamente comentarios con alta precisión, además de generar respuestas apropiadas, realizar análisis y crear documentos siguiendo lineamientos específicos.
La evaluación de Nova Forge siguió un marco dual, midiendo el éxito tanto en tareas especializadas como generales. Se comprobó que la mezcla de datos utilizada en el ajuste no solo mejora el rendimiento en tareas de nicho, sino que también mitiga el riesgo de olvidar tareas generales, estableciendo un equilibrio eficaz entre especialización y versatilidad.
Los resultados sugieren que combinar el SFT supervisado con la mezcla de datos de Nova Forge puede ser esencial para organizaciones que busquen maximizar la efectividad de sus modelos y manejar múltiples flujos de trabajo sin tener que sacrificar habilidades generales.
Con Nova Forge, Amazon redefine el panorama de la inteligencia artificial empresarial al posibilitar la especialización sin comprometer la inteligencia general, ofreciendo nuevas oportunidades para la implementación de soluciones de IA avanzadas en diversos sectores.








