Histórico Colapso en Moscú: Yandex Enfrenta Parálisis de Centro de Datos por Apagón Eléctrico

El 30 de marzo pasado, el principal centro de datos de Yandex experimentó una interrupción de servicio sin precedentes, afectando a múltiples servicios esenciales, incluyendo Yandex Cloud. Esta interrupción, descrita por la compañía como un evento de una probabilidad de ocurrencia una vez cada 20 años, se debió a una falla simultánea de ambas líneas de alimentación de alta tensión que provenían de una subestación cercana a Moscú.

El centro de datos, inaugurado en la década de 2010 en un terreno previamente industrial, había operado sin incidentes desde su puesta en marcha gracias a su proximidad a una subestación potente de 220 kV. Yandex había implementado dos líneas de alimentación de 110 kV para asegurar redundancia suficiente. Sin embargo, ambas líneas fallaron al mismo tiempo, lo que provocó un evento crítico.

El apagón comenzó a las 12:25 hora local, lo que obligó a Yandex a activar sus generadores diésel de emergencia y a depender de sus sistemas de alimentación ininterrumpida diesel-rotativas (DUPS). Aunque los elementos críticos de infraestructura y monitorización permanecieron operativos, la zona de disponibilidad ru-central1-b de Yandex Cloud quedó paralizada durante varias horas. El suministro eléctrico se restableció a las 15:30, pero la recuperación completa de la infraestructura se alargó hasta la medianoche debido a la complejidad del proceso, el cual requirió validaciones manuales y supervisión directa de ingenieros.

A raíz de este evento, Yandex ha iniciado una revisión exhaustiva de su modelo de resiliencia energética. La compañía está considerando la adición de un tercer nivel de respaldo mediante generadores y planea implementar ejercicios más rigurosos de recuperación ante desastres que simulen fallos dobles. Además, se buscará mejorar la automatización de los procesos de reinicio de sistemas para agilizar la recuperación en casos similares.

Dentro de estas medidas, también se priorizará el fortalecimiento de las herramientas de resiliencia multizona en Yandex Cloud, destacándose la tecnología “Zonal Shift”, que permite redirigir automáticamente el tráfico a otras zonas para mitigar el impacto de un fallo.

El incidente de Yandex subraya la importancia de considerar riesgos excepcionales en la planificación de infraestructuras críticas. En ese contexto, la empresa ha señalado que la utilización de infraestructuras multizona no es opcional, sino esencial para cualquier servicio de misión crítica. Yandex sigue su camino para reforzar su infraestructura dentro de Rusia, operando varios centros de datos en diferentes ubicaciones y apostando por el futuro de la tecnología en el país. Este caso se convertirá en un estudio de referencia para la industria tecnológica, recordando la importancia de la planificación extrema y la transparencia en la gestión de incidentes críticos.

Cayetano Andaluz
Cayetano Andaluz
Periodista y redactor de noticias de actualidad sobre Andalucía y sus provincias. También información en general.

Compartir artículo:

Más popular

Más artículos como este
Relacionados

Enagás Apuesta por el Futuro Sostenible a Través del Hidrógeno Verde

Enagás apuesta decisivamente por el hidrógeno como motor de...

Domina la Escalera del Infierno: El Ejercicio Definitivo para Fortalecer tus Glúteos

Ana Arrechea, reconocida por su destacada labor como creadora...

Reacción Desde Casa: El Día que Recibí Vuestra Llamada

El conocido humorista Juan Dávila visitó el programa "La...