En el evento EVOLVE25 NYC, Cloudera ha dado un paso más en su apuesta por un «lakehouse» abierto basado en Apache Iceberg, anunciando la integración del Cloudera Iceberg REST Catalog y el Cloudera Lakehouse Optimizer en toda su plataforma. Estas nuevas funcionalidades están ya disponibles y ofrecen mejoras significativas en el intercambio de datos y la eficiencia del almacenamiento.
El Cloudera Iceberg REST Catalog permite compartir datos sin copias y con metadatos unificados a través de un catálogo que expone tablas y metadatos vía REST. Esto permite una interoperabilidad sin copias con motores de terceros como Snowflake, Databricks y AWS Athena. El objetivo es romper con los silos de datos y gobernanza inconsistente, unificando políticas de acceso y auditoría bajo su Shared Data Experience (SDX).
Por otro lado, el Cloudera Lakehouse Optimizer promete una optimización automática y mantenimiento inteligente de tablas Iceberg. Según pruebas internas de Cloudera, esta herramienta puede acelerar consultas hasta 13 veces y reducir el almacenamiento en un 36%. Además, será el único servicio de este tipo que estará disponible on-premises en el futuro, lo que representa una ventaja significativa para industrias reguladas.
Estos avances están diseñados para disminuir los costos asociados al movimiento de datos y facilitar el uso de inteligencia artificial “en cualquier nube” sin desplazar los datos. Al ofrecer un gobierno y seguridad unificados, Cloudera intenta posicionarse al frente de la interoperabilidad y la soberanía de datos, permitiendo que las empresas puedan aprovechar Iceberg como formato estándar sin quedar atrapadas en estructuras propietarias.
En resumen, Cloudera busca simplificar la arquitectura de datos al ofrecer una solución integrada que facilita el control y la visibilidad, reduciendo a su vez el costo total de propiedad. Esta iniciativa promete transformaciones significativas en cómo los equipos de datos pueden colaborar de manera más efectiva y cómo los CFO pueden optimizar costos y mejorar el retorno de inversión en tecnología de datos.