
Szeroka przerwa w Amazon Web Services (AWS) Dziś rano wirus spowodował awarie na dużą skalę w dziesiątkach aplikacji, stron internetowych i usług cyfrowych na całym świecie. Odnotowano pierwsze ostrzeżenia. od 08:40 do 09:00 (czasu półwyspowego)ze szczególnym uwzględnieniem usług zależnych od regionu US-EAST-1.
Spadek nie ogranicza się do jednego produktu: obejmuje on zarówno asystentów głosowych i streaming, jak i narzędzia do pracy, sieci społecznościowe i gry wideo. W Hiszpanii odnotowano również incydenty związane z płatności kartą i Bizum, a także problemy z telefonami komórkowymi obsługującymi transmisję danych i niektórymi bankomatami, w wyniku których wiele firm tymczasowo musiało korzystać z gotówki.
Co się teraz dzieje
Amazon rozpoznał w swoim panelu statusu anomalny wzrost liczby błędów i opóźnień w różnych usługach świadczonych w regionie US-EAST-1 (Północna Wirginia)Firma zapewnia, że jej zespoły techniczne pracują nad przywróceniem normalności i że w miarę upływu godzin obserwuje się wyraźne oznaki ożywienia w większości próśb.
Przez cały poranek pojawiało się kilka aktualizacji: najpierw potwierdzono incydent (kilka minut po godzinie 09:00), następnie przekazano, że Większość operacji powinna rozpocząć się pomyślnie, a później wskazano, że źródło problemów było związane z rozwiązanie DNS powiązane z DynamoDBPoprawa sytuacji nastąpiła po wyeliminowaniu tego problemu, chociaż nadal mogą pojawiać się błędy resztkowe.
W przypadku osób, u których nadal występują błędy podczas łączenia się z określonymi usługami, AWS zaleca prośby o ponowienie próby i w określonych przypadkach opróżnić pamięć podręczną DNS, zwłaszcza jeśli problemy z punktami końcowymi DynamoDB w danym regionie nadal występują.
Raporty z platform śledzenia incydentów wykazały, że stały spadek liczby raportów w miarę zbliżania się południa, co wskazuje na stopniową i etapową poprawę sytuacji, zależną od usługi i lokalizacji.

Usługi i platformy z incydentami
Zakres usług, na które ma to wpływ, jest szeroki i zróżnicowany. Wśród najczęściej wymienianych przez użytkowników i firmy są Alexa i Prime Video. ekosystem amazonkioraz wiele aplikacji innych firm, które korzystają z infrastruktury AWS.
- rozrywka i gry: Fortnite, Roblox, Clash Royale, PUBG, Rainbow Six Siege, Crunchyroll i Prime Video zgłaszano błędy połączenia i okresowe przerwy w połączeniu.
- Produktywność i tworzenie:Canva, Duolingo, Trello, Slack, Zoom i Dropbox pokazały niestabilny dostęp i długi czas reakcji.
- Sieci i wiadomości:Reddit i Snapchat zebrały raporty dotyczące błędy ładowania i chwilowe blokady.
- Sztuczna inteligencja i asystenci: Perplexity i urządzenia obsługujące Alexę oraz Generacyjna sztuczna inteligencja AmazonaI kamery i dzwonki do drzwi ekosystemu Ring doświadczyły przerw w działaniu funkcji.
- Płatności i handel:incydenty w telefonach danych, bizum a niektóre bramy wymusiły zawieszenie określonych operacji; Ticketmaster Opóźniło to nawet sprzedaż biletów, na przykład tych planowanych na La Oreja de Van Gogh.

Gdzie problem był najbardziej zauważalny i dlaczego dotyczy osób spoza USA.
Incydenty koncentrowały się na wschodnim wybrzeżu Stanów Zjednoczonych (z momentami szczytowymi w Nowy Jork, Los Angeles, San Francisco i Seattle), ale problemy zgłaszano również w Wielkiej Brytanii (Londyn i Manchester) oraz w kilku krajach europejskich. Chociaż epicentrum znajduje się w regionie US-EAST-1, wiele globalnych usług jest zależnych od tego regionu w zakresie kluczowych części swojej działalności.
W praktyce oznacza to, że niektóre aplikacje Pozostają dostępne, ale z ograniczonymi funkcjamilub nie aktualizuj treści w czasie rzeczywistym. Ta rozproszona architektura wyjaśnia, dlaczego lokalna awaria może mieć efekt domina na inne regionynawet jeśli europejskie lub azjatyckie centra danych nadal będą działać.
Orientacyjna chronologia zdarzenia
• Wśród 08: 40 y 09: 00 (czas półwyspowy) pojawiają się pierwsze szczyty raportów. • Około 09:30AWS potwierdza problemy, które zwiększyć wskaźniki błędów i opóźnienia w różnych usługach. • Wokół 11:00Amazon informuje, że zidentyfikował możliwą przyczynę i pracuje nad jej złagodzeniem. • Po 11:30, komunikuje się wyraźne oznaki ożywienia• W południe liczba zgłoszeń spada, a większość usług jest niedostępna. są stopniowo przywracane.
Mimo to firma ostrzega przed możliwymi pozostałe incydenty w niektórych operacjach i zaleca ponowne próby, aż do momentu całkowitego przywrócenia normalności na wszystkich frontach.
Jak to na Ciebie wpływa i co możesz zrobić
Jeśli zauważysz, że strona internetowa się nie ładuje, Alexa nie odpowiadaJeśli gra online nie łączy się z siecią lub aplikacja służbowa ma problemy, prawdopodobnie usługa jest zależna od AWS i znajduje się w fazie odzyskiwania. W takich przypadkach Ponowne uruchomienie routera lub urządzenia zazwyczaj nie pomaga.; Najbardziej skutecznym rozwiązaniem jest odczekanie i ponowna próba później.
W środowiskach zawodowych zaleca się planowanie zadań krytycznych z uwzględnieniem marginesu i, jeśli to możliwe, włącz ponowne próby i limity czasu bardziej hojny w przypadku integracji zależnych od punktów końcowych AWS. W bardzo specyficznych scenariuszach opróżnianie Pamięć podręczna DNS może przyspieszyć ponowne nawiązanie połączenia z niektórymi usługami, które zostały już przywrócone.
Przypomnienie o zależności od chmury
Z udziałem w rynku przekraczającym 30% Na całym świecie AWS stanowi podstawę tysięcy firm cyfrowych. Gdy incydent dotyka kluczowego regionu, takiego jak US-EAST-1, fala uderzeniowa Jest to widoczne w aplikacjach używanych codziennie przez miliony ludzi, od streamingu i gier po bankowość i handel elektroniczny.
Dzisiejszy odcinek ponownie porusza kwestię potrzeby odporne architektury (wieloregionalne, wielowarstwowe i z kontrolowaną degradacją), a także jasne strategie komunikacji służące zarządzaniu oczekiwania użytkowników i klientów gdy wystąpią poważne zakłócenia.
Po kilku godzinach prac łagodzących prowadzonych przez Amazon sytuacja wskazuje na stopniowa regeneracja w większości usług, z widoczną poprawą dostępu i opóźnień. Nadal mogą występować małe wstrząsyJednak tendencja jest pozytywna i wszystko wskazuje na to, że ruch wraca do normy na niektórych odcinkach, gdyż w dotkniętym regionie zakończono już prace dostosowawcze.