Más de 2.2 mil millones de personas en todo el mundo enfrentan algún tipo de discapacidad visual, según datos de la Organización Mundial de la Salud. Frente a esta realidad, la accesibilidad en medios visuales como televisión y cine se ha vuelto un tema esencial, impulsado por legislaciones como la Ley de Estadounidenses con Discapacidades. Estas normas demandan descripciones de audio obligatorias para facilitar el acceso de personas con discapacidades visuales.
La creación de dicho contenido accesible ha sido, tradicionalmente, un proceso costoso y complejo, requiriendo la colaboración de creadores, narradores y técnicos, con costos que pueden alcanzar los 25 dólares por minuto al externalizar el trabajo. Sin embargo, la introducción de modelos de inteligencia artificial generativa promete alivianar estos desafíos.
Amazon Nova, una nueva serie de modelos IA, presenta una solución potencial. Lanzados recientemente a través de Amazon Bedrock, estos modelos – Amazon Nova Lite, Pro y Premier – están diseñados para optimizar el análisis audiovisual y generar descripciones de audio de manera más eficiente. Este avance no solo podría reducir costos, sino también acelerar el tiempo de producción, ayudando a cumplir con los requerimientos de accesibilidad de manera más efectiva.
El proceso tecnológico incluye el uso de herramientas como Amazon Rekognition para segmentar videos e identificar cambios visuales, y Amazon Polly para convertir texto en audio. Esto establece un flujo de trabajo automatizado que permite a las empresas de medios crear contenido accesible más fácilmente. Aunque no es una solución integral lista para su inmediata implementación, ofrece un marco flexible para que las organizaciones lo adapten a sus necesidades.
La introducción de automatización en descripciones de audio podría revolucionar la accesibilidad del contenido audiovisual. En un mundo donde cumplir con normativas de accesibilidad es cada vez más crucial, las innovadoras soluciones de inteligencia artificial de Amazon emergen como un recurso esencial para mejorar la inclusión de personas con discapacidades visuales en toda la industria mediática.