Histórico Apagón de Cloudflare en 2023: Fallo Interno Causa Errores 5xx en Medio Internet

3
minutos de tiempo de lectura
Cloudflare frena el ataque DDoS mas grande de la historia

El 18 de noviembre de 2025, Cloudflare, un actor fundamental en la infraestructura de internet, experimentó un apagón global que afectó a millones de usuarios en todo el mundo. Durante el incidente, numerosas páginas web que dependen de sus servicios mostraron errores HTTP 5xx en lugar del contenido esperado. Tras una investigación exhaustiva, la empresa confirmó que el origen del problema fue un fallo interno, no un ciberataque.

Los detalles técnicos revelan que el problema se inició alrededor de las 11:20 (UTC) debido a un cambio en los permisos de bases de datos que alimentan su sistema de gestión de bots. Este cambio desató una secuencia de errores, comenzando con la generación de un fichero de configuración descomunalmente grande por un módulo dentro de su clúster de bases de datos ClickHouse. El fichero en cuestión, que incrementó significativamente el número de características (features), resultó ser demasiado voluminoso para el sistema, causando que el módulo de bot fallara y, a su vez, desestabilizara el proxy central de Cloudflare.

Durante las primeras horas del incidente, los equipos de Cloudflare sospecharon de un posible ataque DDoS debido al comportamiento intermitente del sistema. Sin embargo, la detección de que el origen del incidente residía en cambios de configuración interna, aclaró que se trataba de un fallo interno. El tráfico comenzó a recuperarse después de que los ingenieros lograron identificar la falla del fichero y reestablecieron una versión válida.

El fallo tuvo un impacto significativo no solo en el servicio principal de CDN y seguridad, sino también en varios otros servicios como Workers KV, Cloudflare Access y Turnstile. Adicionalmente, la capacidad de observación del sistema se vio saturada durante el incidente, lo que incrementó la latencia de las respuestas y complicó aún más la gestión de la crisis.

Cloudflare también estaba en proceso de migración a una nueva versión de su proxy, denominada FL2, que sufrió las consecuencias del incidente junto con la versión antigua. La nueva versión tradujo los fallos en errores HTTP visibles, mientras que la versión antigua enfrentó otros problemas como falsos positivos en la detección de bots.

Frente a este fallo, la compañía ha delineado una serie de medidas preventivas: endurecer la gestión de ficheros de configuración interna, introducir mecanismos que permitan desactivar módulos sin derribar el sistema completo y asegurar que los sistemas de diagnóstico no contribuyan a la saturación de recursos durante las crisis.

Cloudflare ha reconocido la gravedad del incidente y enfatiza que es un recordatorio de la fragilidad de la infraestructura digital. Con el compromiso de reforzar su plataforma, la empresa busca asegurar una mayor resiliencia para prevenir futuros incidentes de esta naturaleza. Este enfoque subraya la transparencia como una necesariedad en la gestión de crisis dentro del ecosistema de internet, sobre todo cuando gran parte del tráfico global depende de pocos proveedores de infraestructura.

TE PUEDE INTERESAR

Histórico Apagón de Cloudflare en 2023: Fallo Interno Causa Errores 5xx en Medio Internet — Andalucía Informa