Optimización Ágil de Ajuste de Modelos de Lenguaje con Datos No Estructurados mediante SageMaker Unified Studio y S3

3
minutos de tiempo de lectura
Elena Digital López

AWS ha dado un paso significativo en el ámbito del aprendizaje automático con la presentación de una innovadora integración entre Amazon SageMaker Unified Studio y los buckets de Amazon S3. Esta colaboración promete cambiar radicalmente la manera en que las organizaciones procesan y analizan grandes volúmenes de datos no estructurados, facilitando así tareas complejas de análisis de datos.

Recientemente, se realizó un ejercicio para demostración, integrando estos buckets de S3 con el catálogo de Amazon SageMaker para afinar el modelo Llama 3.2 11B Vision Instruct, centrado especialmente en responder preguntas visuales. El modelo mostró su capacidad al realizar consultas como identificar la fecha de una transacción en un recibo, simplemente al ser alimentado con imágenes y preguntas.

El rendimiento del modelo base Llama 3.2 fue prometedor, logrando un promedio de Similaridad de Levenshtein Normalizada (ANLS) del 85,3% en el exigente conjunto de datos DocVQA. Aun así, para la precisión que requieren ciertas tareas, no fue suficiente, por lo que se implementó un protocolo de ajuste fino. Este protocolo evaluó cómo el tamaño del conjunto de datos de entrenamiento, con tamaños de 1,000, 5,000 y 10,000 imágenes, impactaba el rendimiento final del modelo.

El proceso de ajuste abarcó desde la ingesta de datos hasta la creación y evaluación del modelo, todo bajo la gestión unificada de Amazon SageMaker Unified Studio. Antes de comenzar, las organizaciones deben cumplir ciertos requisitos, como la creación de un dominio en el estudio y establecer conexiones seguras con los buckets de S3.

Un punto clave de esta metodología es la importancia de una arquitectura bien diseñada que permita la colaboración efectiva de los equipos de datos, mediante el uso de roles de acceso que faciliten la gestión de permisos. Asimismo, la implementación de MLflow permitió un seguimiento detallado de los experimentos, comprobando mejoras en la precisión del modelo ajustado.

Los resultados preliminares de esta estrategia fueron alentadores, con el mejor modelo ajustado alcanzando un ANLS de 90,2%, reflejando una mejora del 4,9% con respecto al modelo original. Esta mejora demuestra no solo la validez del enfoque adoptado, sino también el potencial del Amazon SageMaker Unified Studio para optimizar modelos de aprendizaje automático, permitiendo un tránsito más eficaz desde los datos no estructurados hasta su implementación funcional en la práctica.

TE PUEDE INTERESAR