Globalna awaria AWS powoduje masowe przerwy w działaniu stron internetowych, aplikacji i płatności

  • Awaria portu US-EAST-1 (Północna Wirginia) powoduje błędy i opóźnienia w wielu usługach AWS.
  • Incydenty wykryto pomiędzy godziną 08:40 a 09:00 (czasu półwyspowego) i potwierdzono przez Amazon wkrótce potem.
  • Najważniejsze platformy, których to dotyczy: Alexa, Prime Video, Fortnite, Roblox, Canva, Duolingo, Reddit i inne.
  • AWS omawia oznaki ożywienia i zaleca ponowienie operacji w celu złagodzenia problemu z DNS związanego z DynamoDB.

Zakłócenie usług w chmurze AWS

Szeroka przerwa w Amazon Web Services (AWS) Dziś rano wirus spowodował awarie na dużą skalę w dziesiątkach aplikacji, stron internetowych i usług cyfrowych na całym świecie. Odnotowano pierwsze ostrzeżenia. od 08:40 do 09:00 (czasu półwyspowego)ze szczególnym uwzględnieniem usług zależnych od regionu US-EAST-1.

Spadek nie ogranicza się do jednego produktu: obejmuje on zarówno asystentów głosowych i streaming, jak i narzędzia do pracy, sieci społecznościowe i gry wideo. W Hiszpanii odnotowano również incydenty związane z płatności kartą i Bizum, a także problemy z telefonami komórkowymi obsługującymi transmisję danych i niektórymi bankomatami, w wyniku których wiele firm tymczasowo musiało korzystać z gotówki.

Co się teraz dzieje

Amazon rozpoznał w swoim panelu statusu anomalny wzrost liczby błędów i opóźnień w różnych usługach świadczonych w regionie US-EAST-1 (Północna Wirginia)Firma zapewnia, że ​​jej zespoły techniczne pracują nad przywróceniem normalności i że w miarę upływu godzin obserwuje się wyraźne oznaki ożywienia w większości próśb.

Przez cały poranek pojawiało się kilka aktualizacji: najpierw potwierdzono incydent (kilka minut po godzinie 09:00), następnie przekazano, że Większość operacji powinna rozpocząć się pomyślnie, a później wskazano, że źródło problemów było związane z rozwiązanie DNS powiązane z DynamoDBPoprawa sytuacji nastąpiła po wyeliminowaniu tego problemu, chociaż nadal mogą pojawiać się błędy resztkowe.

W przypadku osób, u których nadal występują błędy podczas łączenia się z określonymi usługami, AWS zaleca prośby o ponowienie próby i w określonych przypadkach opróżnić pamięć podręczną DNS, zwłaszcza jeśli problemy z punktami końcowymi DynamoDB w danym regionie nadal występują.

Raporty z platform śledzenia incydentów wykazały, że stały spadek liczby raportów w miarę zbliżania się południa, co wskazuje na stopniową i etapową poprawę sytuacji, zależną od usługi i lokalizacji.

Usługi dotknięte awarią AWS

Usługi i platformy z incydentami

Zakres usług, na które ma to wpływ, jest szeroki i zróżnicowany. Wśród najczęściej wymienianych przez użytkowników i firmy są Alexa i Prime Video. ekosystem amazonkioraz wiele aplikacji innych firm, które korzystają z infrastruktury AWS.

  • rozrywka i gry: Fortnite, Roblox, Clash Royale, PUBG, Rainbow Six Siege, Crunchyroll i Prime Video zgłaszano błędy połączenia i okresowe przerwy w połączeniu.
  • Produktywność i tworzenie:Canva, Duolingo, Trello, Slack, Zoom i Dropbox pokazały niestabilny dostęp i długi czas reakcji.
  • Sieci i wiadomości:Reddit i Snapchat zebrały raporty dotyczące błędy ładowania i chwilowe blokady.
  • Sztuczna inteligencja i asystenci: Perplexity i urządzenia obsługujące Alexę oraz Generacyjna sztuczna inteligencja AmazonaI kamery i dzwonki do drzwi ekosystemu Ring doświadczyły przerw w działaniu funkcji.
  • Płatności i handel:incydenty w telefonach danych, bizum a niektóre bramy wymusiły zawieszenie określonych operacji; Ticketmaster Opóźniło to nawet sprzedaż biletów, na przykład tych planowanych na La Oreja de Van Gogh.

Globalny zakres incydentu w AWS

Gdzie problem był najbardziej zauważalny i dlaczego dotyczy osób spoza USA.

Incydenty koncentrowały się na wschodnim wybrzeżu Stanów Zjednoczonych (z momentami szczytowymi w Nowy Jork, Los Angeles, San Francisco i Seattle), ale problemy zgłaszano również w Wielkiej Brytanii (Londyn i Manchester) oraz w kilku krajach europejskich. Chociaż epicentrum znajduje się w regionie US-EAST-1, wiele globalnych usług jest zależnych od tego regionu w zakresie kluczowych części swojej działalności.

W praktyce oznacza to, że niektóre aplikacje Pozostają dostępne, ale z ograniczonymi funkcjamilub nie aktualizuj treści w czasie rzeczywistym. Ta rozproszona architektura wyjaśnia, dlaczego lokalna awaria może mieć efekt domina na inne regionynawet jeśli europejskie lub azjatyckie centra danych nadal będą działać.

Orientacyjna chronologia zdarzenia

• Wśród 08: 40 y 09: 00 (czas półwyspowy) pojawiają się pierwsze szczyty raportów. • Około 09:30AWS potwierdza problemy, które zwiększyć wskaźniki błędów i opóźnienia w różnych usługach. • Wokół 11:00Amazon informuje, że zidentyfikował możliwą przyczynę i pracuje nad jej złagodzeniem. • Po 11:30, komunikuje się wyraźne oznaki ożywienia• W południe liczba zgłoszeń spada, a większość usług jest niedostępna. są stopniowo przywracane.

Mimo to firma ostrzega przed możliwymi pozostałe incydenty w niektórych operacjach i zaleca ponowne próby, aż do momentu całkowitego przywrócenia normalności na wszystkich frontach.

Jak to na Ciebie wpływa i co możesz zrobić

Jeśli zauważysz, że strona internetowa się nie ładuje, Alexa nie odpowiadaJeśli gra online nie łączy się z siecią lub aplikacja służbowa ma problemy, prawdopodobnie usługa jest zależna od AWS i znajduje się w fazie odzyskiwania. W takich przypadkach Ponowne uruchomienie routera lub urządzenia zazwyczaj nie pomaga.; Najbardziej skutecznym rozwiązaniem jest odczekanie i ponowna próba później.

W środowiskach zawodowych zaleca się planowanie zadań krytycznych z uwzględnieniem marginesu i, jeśli to możliwe, włącz ponowne próby i limity czasu bardziej hojny w przypadku integracji zależnych od punktów końcowych AWS. W bardzo specyficznych scenariuszach opróżnianie Pamięć podręczna DNS może przyspieszyć ponowne nawiązanie połączenia z niektórymi usługami, które zostały już przywrócone.

Przypomnienie o zależności od chmury

Z udziałem w rynku przekraczającym 30% Na całym świecie AWS stanowi podstawę tysięcy firm cyfrowych. Gdy incydent dotyka kluczowego regionu, takiego jak US-EAST-1, fala uderzeniowa Jest to widoczne w aplikacjach używanych codziennie przez miliony ludzi, od streamingu i gier po bankowość i handel elektroniczny.

Dzisiejszy odcinek ponownie porusza kwestię potrzeby odporne architektury (wieloregionalne, wielowarstwowe i z kontrolowaną degradacją), a także jasne strategie komunikacji służące zarządzaniu oczekiwania użytkowników i klientów gdy wystąpią poważne zakłócenia.

Po kilku godzinach prac łagodzących prowadzonych przez Amazon sytuacja wskazuje na stopniowa regeneracja w większości usług, z widoczną poprawą dostępu i opóźnień. Nadal mogą występować małe wstrząsyJednak tendencja jest pozytywna i wszystko wskazuje na to, że ruch wraca do normy na niektórych odcinkach, gdyż w dotkniętym regionie zakończono już prace dostosowawcze.

Pracownicy generatywnej sztucznej inteligencji Amazona
Podobne artykuł:
Amazon Generative AI: jak tworzyć oryginalne treści za pomocą AI