Las empresas que emplean Amazon SageMaker Canvas en sus flujos de trabajo de aprendizaje automático ahora tienen una solución para integrar dependencias externas esenciales en casos de uso específicos. Aunque esta plataforma robusta proporciona un entorno sin código y de bajo código para la experimentación ágil, algunos proyectos requieren librerías personalizadas que la plataforma no incluye por defecto. Un caso de estudio reciente revela cómo los usuarios pueden integrar código que depende de estas librerías externas dentro de los flujos de trabajo de SageMaker Canvas.
Amazon SageMaker Canvas se destaca como una herramienta de bajo código que acompaña a los usuarios en todas las etapas del aprendizaje automático, desde la preparación de datos hasta la implementación del modelo final. Con una serie de capacidades avanzadas, como más de 300 pasos de transformación incorporados, la herramienta permite a los usuarios explorar conjuntos de datos, transformarlos, construir modelos y generar predicciones sin necesidad de codificación.
El proceso de integrar scripts personalizados y sus dependencias desde Amazon Simple Storage Service (Amazon S3) en un flujo de trabajo de SageMaker Data Wrangler se desarrolla en tres pasos clave: la carga de scripts y sus dependencias en Amazon S3, la transformación de datos en SageMaker Canvas utilizando estos scripts, y finalmente, el entrenamiento y exportación del modelo.
En un ejemplo práctico, se utilizaron dos conjuntos de datos relacionados con los envíos de pantallas de computadora. Al combinarlos, se obtuvo un conjunto de datos completo que capturó métricas valiosas y resultados de entrega. El objetivo fue desarrollar un modelo predictivo para anticipar si futuros envíos llegarán a tiempo, basándose en patrones históricos de envío.
Para implementar este proceso, los usuarios primero deben tener acceso a Amazon S3 y Amazon SageMaker AI. Luego, en la consola de SageMaker AI, deben abrir Canvas y crear un flujo de datos seleccionando conjuntos de datos específicos. Tras cargar y transformar los datos, pueden añadir cálculos personalizados con funciones que dependen de librerías externas como mpmath
.
Al introducir funciones que requieren módulos no soportados, se debe empaquetar el script y sus dependencias en un archivo .zip, y luego subirlo a un bucket de Amazon S3. Una vez cargado el archivo, es posible acceder a él desde SageMaker Canvas y ejecutar el script, integrando así nuevas funcionalidades en el flujo de trabajo.
El proceso culmina con el entrenamiento del modelo predictivo empleando las características y el objetivo adecuados. En los ejemplos presentados, el modelo logró una precisión del 94.5%, subrayando la eficacia de esta metodología.
Finalmente, el modelo terminado ofrece múltiples opciones de uso, como la implementación directa, la adición al registro de modelos de SageMaker o la exportación a un notebook de Jupyter. Para maximizar los recursos y gestionar costos, se recomienda cerrar sesión una vez concluido el trabajo o configurar el entorno para apagarse automáticamente cuando no está en uso.
Este enfoque extiende las capacidades de SageMaker Canvas al permitir la integración de herramientas personalizadas, potenciando el éxito de proyectos de aprendizaje automático a través de dependencias esenciales integradas en flujos de trabajo personalizados.