F5 Optimiza «Fábricas de IA» con BIG-IP Next en NVIDIA BlueField-4 DPU: Rendimiento Mejorado y Seguridad Zero-Trust

F5 Networks ha anunciado la expansión de su solución BIG-IP Next for Kubernetes, integrada ahora con las nuevas NVIDIA BlueField-4 DPU. Este desarrollo está dirigido a las fábricas de IA a gigascala, prometiendo un incremento significativo en el rendimiento de la red y la seguridad. La colaboración entre ambas compañías asegura una capacidad de red multi-tenant de hasta 800 Gb/s, con mejoras en la aceleración de cargas LLM y seguridad zero-trust.

La integración de F5 y BlueField-4 se centra en trasladar funciones de red y seguridad al DPU, liberando así a las GPU de tareas que no están directamente relacionadas con la inteligencia artificial, y logrando una reducción en las latencias. Este avance es crucial en entornos donde cada microsegundo cuenta, especialmente en contextos con agentes autónomos y tráfico multi-modelo.

La propuesta promete una serie de beneficios clave:

  1. Rendimiento Mejorado: Al descargar el data path y los controles hacia el DPU, se logra un aumento del 30% en la capacidad de generación de tokens. Esto asegura un aislamiento eficaz entre inquilinos a través de la velocidad de red mencionada.

  2. Optimización de la Inferencia LLM: Gracias a la integración con NVIDIA Dynamo y KV Cache Manager, se reduce la latencia y se aprovecha mejor la GPU, permitiendo un servicio desagregado que se adapta a cambios en los prompts y contextos.

  3. Enrutado Inteligente Multimodelo: Mediante NVIDIA NIM, el control plane de F5 dirige el tráfico entre diferentes modelos para optimizar el TTFT, coste o calidad.

  4. Gobernanza Granular de Tokens: Se ofrece visibilidad y métricas esenciales para cumplimiento, contabilidad y gestión de riesgos.

  5. Seguridad Mejorada: Con el uso de NVIDIA DOCA Platform Framework, se garantiza un entorno seguro en redes de IA distribuidas con segmentación de inquilinos.

  6. Programabilidad: Las F5 iRules pueden aplicarse a flujos de IA para crear políticas de seguridad personalizadas.

Este avance es significativo para las modernas cargas de IA, permitiendo más eficiencia, seguridad y gobernanza sin sacrificar el rendimiento. En particular, las capacidades de balanceo y micro-segmentación ofrecen una gestión más eficaz en entornos complejos y regulados.

A medida que las organizaciones buscan maximizar el uso de sus infraestructuras de IA, la desagregación del serving del cálculo en GPU y el traslado de la red y seguridad al DPU permiten escalar con eficiencia mientras se mantienen altos estándares de calidad de servicio. Los detalles subrayan que el éxito de la integración dependerá del diseño adecuado y de un ajuste preciso de las condiciones operativas.

Este anuncio representa un paso importante hacia el futuro de las fábricas de IA, poniendo en relieve el potencial transformador de combinar la tecnología de F5 y NVIDIA para mejorar el rendimiento y la seguridad en entornos a gran escala.

Cayetano Andaluz
Cayetano Andaluz
Periodista y redactor de noticias de actualidad sobre Andalucía y sus provincias. También información en general.

Compartir artículo:

Más popular

Más artículos como este
Relacionados

Demanda Legal Revela Preocupaciones sobre la Privacidad en la Función de Reconocimiento Facial de Ring

Amazon Ring ha anunciado el lanzamiento de su nueva...

Sandra Barneda y Xuxo Jones Encabezarán las Campanadas en Mediaset

Mediaset ha revelado que Sandra Barneda y Xuso Jones...

Fallece Dick Cheney, influyente vicepresidente y estratega clave de la guerra contra el terror

Donald Rumsfeld, quien anteriormente fue congresista, secretario de Defensa...