Las organizaciones de diversos sectores enfrentan constantes desafíos al convertir grabaciones de reuniones en documentos estructurados. Este proceso, que implica revisar grabaciones, transcribir contenido hablado y sincronizar elementos visuales, suele ser laborioso y afecta la productividad, especialmente cuando se manejan múltiples grabaciones de conferencias y materiales educativos.
Para abordar este reto, Amazon ha introducido una solución automatizada sin servidor, utilizando la inteligencia artificial de Amazon Bedrock. Esta tecnología permite transformar grabaciones de seminarios en minutas completas, proporcionando transcripciones y detectando cambios de diapositivas. La automatización está habilitada por funciones personalizadas de AWS Lambda y AWS Step Functions, que refinan las transcripciones para mayor precisión.
Amazon Bedrock aborda datos multimodales, como imágenes y videos, y los convierte en formatos estructurados personalizables. Es capaz de extraer segmentos de audio, resumir escenas y detectar contenido explícito, mejorando así la gestión y escalabilidad del contenido.
El flujo de trabajo inicia con la carga de un video en Amazon Simple Storage Service (S3), lo que activa un proceso de análisis mediante Amazon EventBridge. Amazon Bedrock identifica cambios en las diapositivas y sincroniza el contenido visual con el verbal. Estos pasos se realizan en paralelo, generando capturas de pantalla y mejorando las transcripciones, eliminando errores.
Las minutas finales se producen usando Python-PPTX, combinando transcripciones refinadas con imágenes. Este material se almacena en Amazon S3, listo para su distribución. La solución no solo reduce el esfuerzo manual, sino que también facilita la integración en organizaciones de todos los tamaños, optimizando recursos y eficiencia.