La inteligencia artificial generativa está revolucionando la industria musical al permitir que, independientemente del nivel de habilidad, los creadores puedan producir pistas de calidad de estudio en tiempo real. En este contexto, Splash Music ha dado un paso adelante al asociarse con AWS para escalar sus modelos de generación musical, haciendo accesible la creación profesional para millones.
Splash Music, en colaboración con el Centro de Innovación en IA Generativa de AWS, ha desarrollado HummingLM, un modelo que establece un nuevo estándar en la música impulsada por inteligencia artificial. Durante la edición 2024 del Acelerador de IA Generativa de AWS, la compañía trabajó estrechamente con AWS Startups para acelerar la innovación en su ciclo de desarrollo.
Con más de 600 millones de transmisiones globales, la plataforma ha empoderado a una nueva generación de creadores. Al adaptar herramientas a los gustos cambiantes de los usuarios, Splash Music ha hecho que la producción sea más accesible. No obstante, el desarrollo de esta tecnología implicó superar obstáculos como la complejidad del modelo y la necesidad de escalar infraestructura. Originalmente, la compañía dependía de clústeres de GPU externos, lo que generaba retrasos y complicaciones.
Para abordar estos desafíos, Splash Music introdujo HummingLM, un modelo generativo de múltiples modalidades que utiliza la codificación de audio Descript-Audio-Codec para producir representaciones comprimidas de alta calidad. Esta arquitectura permite a los usuarios transformar melodías en actuaciones instrumentales sofisticadas.
Gracias a la colaboración con AWS y el uso de instancias Trainium de EC2, Splash Music logró acelerar el desarrollo y rebajar costos de entrenamiento en más del 54%. Además, la automatización de SageMaker HyperPod mejoró la eficiencia operativa reduciendo tiempos de entrenamiento casi a la mitad.
HummingLM no solo avanza en la calidad sonora, sino que también generaliza nuevos presets instrumentales sin necesidad de entrenamiento adicional. La empresa planea expandir diez veces su dataset de entrenamiento y explorar la generación multimodal de audio y vídeo.
Con esta sólida infraestructura y enfoque innovador, Splash Music está redefiniendo la realización de ideas musicales, facilitando la creación de pistas nuevas y personalizadas que llegan a millones. La colaboración continuada con AWS promete un futuro brillante en la música generativa, transformando cómo materializamos nuestras visiones sonoras.