Snowflake Lanza Snowpark Connect para Apache Spark™ en Vista Previa Pública

Snowflake ha dado un paso significativo en la evolución de su plataforma AI Data Cloud con el anuncio de la vista previa pública de «Snowpark Connect para Apache Spark™». Esta nueva funcionalidad permite a los usuarios de Spark ejecutar su código directamente sobre el motor de Snowflake, prometiendo mejoras en rendimiento, reducción de costes y simplificación operativa para organizaciones que manejan grandes cantidades de datos.

La clave de esta innovación radica en su arquitectura cliente-servidor desacoplada, que separa el código del usuario del clúster Spark que realiza el procesamiento. Introducida por la comunidad de Apache Spark™ en su versión 3.4, esta estructura hace posible que los trabajos de Spark sean impulsados por el motor de Snowflake.

Con Snowpark Connect, los usuarios pueden ejecutar código Spark, incluyendo DataFrame, SQL y funciones definidas por el usuario (UDF), sin la necesidad de mantener entornos Spark independientes. Snowflake gestiona el escalado dinámico y optimización del rendimiento, reduciendo así la carga para los desarrolladores.

Además, la transferencia del procesamiento a Snowflake permite establecer un marco único de gobernanza desde el inicio del flujo de datos, asegurando coherencia, seguridad y cumplimiento normativo sin duplicar esfuerzos. Según un estudio interno, los clientes que utilizan Snowpark Client han logrado una mejora del 5,6 veces en rendimiento y una reducción del 41 % en costos, comparado con los entornos Spark tradicionales.

Snowpark Connect se desarrolla sobre la arquitectura de Spark Connect, que permite que las aplicaciones envíen un plan lógico no resuelto a un clúster remoto, eliminando la necesidad de mover datos entre Spark y Snowflake. Actualmente, es compatible con las versiones 3.5.x de Spark, lo que asegura compatibilidad con las últimas funcionalidades.

Los usuarios pueden ejecutar su código a través de Snowflake Notebooks, cuadernos Jupyter, VSCode, y otras plataformas, facilitando una integración fluida con diferentes almacenamientos. Además, trabaja con tablas Apache Iceberg™, sin la necesidad de mover datos o reescribir el código Spark, potenciando así el uso eficiente de un data lakehouse abierto.

Con este desarrollo, Snowflake sigue consolidando su compromiso de ofrecer herramientas eficientes y unificadas para desarrolladores y científicos de datos, integrando lo mejor de Spark en su ecosistema en la nube.

Cayetano Andaluz
Cayetano Andaluz
Periodista y redactor de noticias de actualidad sobre Andalucía y sus provincias. También información en general.

Compartir artículo:

Más popular

Más artículos como este
Relacionados

OCU Evalúa la Crema Nivea: «Eficacia Cuestionada en Estudio Reciente»

La crema Nivea, conocida por su icónica lata azul,...

Ciudad de México Declara Alerta Roja en Seis Alcaldías por Fuertes Inundaciones y Caos Vehicular

La Ciudad de México enfrenta el caos tras fuertes...

Relato de Verano de Elena Medel: Todo lo Que Debes Saber

En la primera entrega de la serie de relatos...

Descubre la Historia: 10 Series y Películas para Aprender y Conocer el Pasado

La narrativa visual en series y películas permite al...