Optimización Ágil de Ajuste de Modelos de Lenguaje con Datos No Estructurados mediante SageMaker Unified Studio y S3

AWS ha dado un paso significativo en el ámbito del aprendizaje automático con la presentación de una innovadora integración entre Amazon SageMaker Unified Studio y los buckets de Amazon S3. Esta colaboración promete cambiar radicalmente la manera en que las organizaciones procesan y analizan grandes volúmenes de datos no estructurados, facilitando así tareas complejas de análisis de datos.

Recientemente, se realizó un ejercicio para demostración, integrando estos buckets de S3 con el catálogo de Amazon SageMaker para afinar el modelo Llama 3.2 11B Vision Instruct, centrado especialmente en responder preguntas visuales. El modelo mostró su capacidad al realizar consultas como identificar la fecha de una transacción en un recibo, simplemente al ser alimentado con imágenes y preguntas.

El rendimiento del modelo base Llama 3.2 fue prometedor, logrando un promedio de Similaridad de Levenshtein Normalizada (ANLS) del 85,3% en el exigente conjunto de datos DocVQA. Aun así, para la precisión que requieren ciertas tareas, no fue suficiente, por lo que se implementó un protocolo de ajuste fino. Este protocolo evaluó cómo el tamaño del conjunto de datos de entrenamiento, con tamaños de 1,000, 5,000 y 10,000 imágenes, impactaba el rendimiento final del modelo.

El proceso de ajuste abarcó desde la ingesta de datos hasta la creación y evaluación del modelo, todo bajo la gestión unificada de Amazon SageMaker Unified Studio. Antes de comenzar, las organizaciones deben cumplir ciertos requisitos, como la creación de un dominio en el estudio y establecer conexiones seguras con los buckets de S3.

Un punto clave de esta metodología es la importancia de una arquitectura bien diseñada que permita la colaboración efectiva de los equipos de datos, mediante el uso de roles de acceso que faciliten la gestión de permisos. Asimismo, la implementación de MLflow permitió un seguimiento detallado de los experimentos, comprobando mejoras en la precisión del modelo ajustado.

Los resultados preliminares de esta estrategia fueron alentadores, con el mejor modelo ajustado alcanzando un ANLS de 90,2%, reflejando una mejora del 4,9% con respecto al modelo original. Esta mejora demuestra no solo la validez del enfoque adoptado, sino también el potencial del Amazon SageMaker Unified Studio para optimizar modelos de aprendizaje automático, permitiendo un tránsito más eficaz desde los datos no estructurados hasta su implementación funcional en la práctica.

Optimización Ágil de Ajuste de Modelos de Lenguaje con Datos No Estructurados mediante SageMaker Unified Studio y S3

TE PUEDE INTERESAR

Desarrollo de IA Contextual y Sensible a la Edad con Guardias de Seguridad en Amazon Bedrock

Samsung Lleva la Experiencia BTS ‘Arirang’ al Mundo con Innovaciones Galaxy

AMD y Celestica Impulsan el Futuro de la IA con Helios: Innovación Abierta en Infraestructura de Racks

Dell Revoluciona su Línea Profesional con IA Avanzada, Mayor Seguridad y Portátiles Ultrafinos

LO MÁS POPULAR

Juan Beaus y Gordon Reid se coronan campeones en dobles del Miami Open de tenis en silla

Marbella será la sede del Campeonato de Andalucía de Tenis Playa

Éxito Organizativo y Dominio Andaluz en el Warriors Tour de Sevilla