El 29 de octubre de 2025, Microsoft Azure, una de las plataformas de computación en la nube líderes en el mundo, experimentó una interrupción importante que interrumpió el servicio para los usuarios en varios continentes. El incidente, que comenzó alrededor de las 15:45 UTC y duró varias horas, afectó a una amplia gama de productos de Microsoft, incluidos los servicios centrales de Azure, aplicaciones de Microsoft 365 como Outlook y Teams, plataformas de juegos como Xbox y Minecraft, y herramientas administrativas como Intune y Power Platform. Este evento subrayó las dependencias críticas que muchas organizaciones e individuos tienen de los proveedores de la nube, lo que generó debates sobre la resiliencia de la infraestructura digital en un mundo cada vez más interconectado.
Causa del mal funcionamiento
La causa principal se identificó como un cambio de configuración involuntario dentro de Azure Front Door, Content Delivery Network (CDN) de Microsoft y el servicio de seguridad Edge. Esta mala configuración provocó errores de resolución del sistema de nombres de dominio (DNS) que impidieron a los usuarios acceder a los servicios, lo que provocó una degradación generalizada de la disponibilidad. El análisis técnico reveló tiempos de espera de HTTP, códigos de error del servidor y una mayor pérdida de paquetes en el borde de la red de Microsoft, lo que exacerbó el problema al bloquear conexiones exitosas. Estos fallos ponen de relieve cómo un único cambio en un entorno de hiperescala puede provocar una disrupción global, ya que Azure Front Door actúa como un punto de acceso central para innumerables servicios interconectados.
Cronología de eventos
La interrupción se extendió gradualmente y Microsoft proporcionó actualizaciones periódicas a través de la página de estado de Azure, aunque la página en sí experimentó problemas intermitentes durante todo el evento. Los primeros informes de problemas surgieron alrededor de las 15:45 UTC, con un pico de quejas de usuarios de más de 18.000 en plataformas como Downdetector a media tarde, hora del Este. Microsoft reconoció el problema poco después y lo atribuyó a problemas relacionados con el DNS. A las 19:01 UTC (15:01 ET), los ingenieros habían identificado una configuración previa estable y comenzaron a implementarla en los nodos afectados.



