Amazon afirma que el servicio en la nube de AWS ha vuelto a la normalidad tras una interrupción que afecta a empresas de todo el mundo

El servicio en nube de Amazon.com volvió a funcionar con normalidad el lunes por la tarde, dijo la compañía, después de una interrupción de internet que causó agitación global entre miles de sitios, incluidas algunas de las aplicaciones más populares de la web como Snapchat y Reddit.

Aún así, Amazon Dijo que algunos servicios de AWS tenían una acumulación de mensajes cuyo procesamiento tomaría algunas horas. AWS aloja aplicaciones y procesos informáticos para empresas de todo el mundo, y la interrupción dejó sin conexión a trabajadores desde Londres hasta Tokio e impidió que otros realizaran tareas cotidianas como pagar a la peluquería o cambiar sus billetes de avión. El lunes por la tarde, los usuarios se quejaron de dificultades persistentes para usar servicios como la billetera digital Venmo y la plataforma de videollamadas Zoom.

Fue la mayor interrupción de Internet desde el fallo de CrowdStrike del año pasado, que paralizó los sistemas tecnológicos en hospitales, bancos y aeropuertos, poniendo de relieve la vulnerabilidad de las tecnologías interconectadas del mundo. Fue al menos la tercera vez en cinco años que el clúster de AWS en el norte de Virginia, conocido como US-EAST-1, contribuyó a un colapso importante de Internet. Amazon no respondió a una solicitud de mayor claridad sobre por qué ese centro de datos en particular sigue viéndose afectado.

Los problemas se derivaron del conocido como Sistema de Nombres de Dominio (DNS), que impedía que las aplicaciones encontraran la dirección correcta para la API DynamoDB de AWS, una base de datos en la nube utilizada para almacenar información de usuarios y otros datos críticos.

LA CAUSA RAÍZ ES EL MONITOR DE SALUD DE LA RED

Anteriormente, AWS dijo que la causa raíz de la interrupción fue un subsistema subyacente que monitorea la salud de sus balanceadores de carga de red utilizados para distribuir el tráfico entre varios servidores. El problema, dijo AWS, se originó dentro de la «red interna EC2», el servicio «Elastic Compute Cloud» de Amazon, que proporciona capacidad de nube a pedido dentro de AWS. Poco después de las 3 p. m. PT (2200 GMT), Amazon dijo: «Todos los servicios de AWS volvieron a funcionar con normalidad. Algunos servicios como AWS Config, Redshift y Connect siguen teniendo una acumulación de mensajes que terminarán de procesar en las próximas horas».

Ken Birman, profesor de informática en la Universidad de Cornell, afirmó que los desarrolladores de software necesitan mejorar la tolerancia a fallos. Explicó que AWS proporciona herramientas que los desarrolladores pueden usar para protegerse en caso de un problema en cualquiera de sus extensas redes de centros de datos, y que también pueden crear copias de seguridad con otros proveedores de la nube. «Cuando las personas recortan costos y hacen recortes en los gastos para intentar lanzar una aplicación, y luego olvidan que se saltaron ese último paso y no se protegieron realmente contra una interrupción, esas empresas son las que realmente deberían ser examinadas más adelante», dijo Birman a Reuters.

PROBLEMA ORIGINADO EN EL SITIO DE AWS CONOCIDO POR INTERRUPCIONES ANTERIORES

AWS proporciona potencia informática, almacenamiento de datos y otros servicios digitales a empresas, gobiernos e individuos y es el mayor proveedor de nube del mundo, seguido por Microsoft Azure y Alphabet Nube de Google.

Gráficos de barras que muestran datos de ingresos y participación de mercado de Amazon, Microsoft, Google y otros pares

Las interrupciones en sus servidores pueden provocar cortes en sitios web y plataformas (desde aplicaciones de entrega de alimentos hasta plataformas de juegos y sistemas de aerolíneas) que dependen de su infraestructura en la nube. AWS indicó en su página de estado que la interrupción del lunes se originó en su ubicación US-EAST-1, la más antigua y grande para servicios web. El sitio sufrió interrupciones en 2021 y 2020. Según la documentación en el sitio web de AWS, el sitio US-EAST-1 suele ser la región predeterminada para muchos servicios de AWS.

«INFRAESTRUCTURAS FRÁGILES»

El problema resalta cuán interconectados se han vuelto los servicios digitales cotidianos y su dependencia de un pequeño número de proveedores globales de nube, con una falla que causa estragos en los negocios y la vida cotidiana, dijeron expertos y académicos. «Esta interrupción resalta una vez más la dependencia que tenemos de infraestructuras relativamente frágiles», dijo Jake Moore, asesor global de ciberseguridad de la firma europea de ciberseguridad ESET. En Gran Bretaña, Lloyd Bank, el Banco de Escocia y los proveedores de servicios de telecomunicaciones Vodafone y BT

Todos fueron afectados, según el sitio web de Downdetector en el Reino Unido, al igual que el sitio web de la autoridad de impuestos, pagos y aduanas del Reino Unido, HMRC. Sin embargo, Vodafone dijo el martes que la interrupción no estaba relacionada con sus redes móviles o de banda ancha. «La razón principal de este problema es que todas estas grandes empresas han dependido de un solo servicio», dijo Nishanth Sastry, director de investigación del Departamento de Ciencias de la Computación de la Universidad de Surrey.

PUBLICIDAD

Ookla, propietaria de Downdetector, dijo que más de 4 millones de usuarios reportaron problemas debido al incidente. «Para las grandes empresas, las horas de inactividad en la nube se traducen en millones en pérdidas de productividad e ingresos», dijo Ryan Griffin, líder de prácticas cibernéticas en EE. UU. de la corredora de seguros McGill and Partners. Wall Street se mantuvo en gran medida imperturbable y las acciones de Amazon subieron un 1,6% a 216,48 dólares.

DE SNAPCHAT A VENMO: UNA INTERRUPCIÓN DEJA CAÍDAS LAS APLICACIONES

Ookla dijo que al menos mil empresas se vieron afectadas por la interrupción. Aplicaciones como Reddit, Roblox, Snapchat y Duolingo Todos habían sido afectados. La startup de inteligencia artificial Perplexity y la plataforma de intercambio de criptomonedas Coinbase y la aplicación de trading Robinhood Todos experimentaron interrupciones en la plataforma y las atribuyeron a AWS. Los propios servicios de Amazon, incluido su sitio web de compras, Prime Video y Alexa, también se vieron afectados. Fortnite, propiedad de Epic Games, Clash Royale y Clash of Clans se encuentran entre las plataformas de juego afectadas.

Uber rival Lyft También fue derribado en Estados Unidos. En una publicación en X, la presidenta de Signal, Meredith Whittaker, confirmó que la aplicación de mensajería se vio afectada por la interrupción, aunque el multimillonario Elon Musk, propietario de X, dijo que su plataforma continuó funcionando.

Información de Shubham Kalia, Devika Nair, Ananya Palyekar y Deborah Sophia en Bengaluru; información adicional de James Pearson, Jaspreet Singh y Arsheeya Bajwa; edición de Saumyadeb Chakrabarty, Joe Bavier, Richard Chang y David Gregorio.

Fuente: reuters