1. 程式人生 > 資訊 >亞馬遜 AWS 大規模宕機原因公佈:自動化服務出現 Bug,導致網路過載

亞馬遜 AWS 大規模宕機原因公佈:自動化服務出現 Bug,導致網路過載

12 月 12 日訊息,12 月 7 日,亞馬遜 AWS 雲服務出現宕機,導致部分網際網路服務離線數小時。

近日,亞馬遜已經查明瞭本次宕機的原因,一項自動化過程導致了中斷,該中斷始於美國東部時間上午 10:30 左右。

據解釋稱,一項用於 AWS 主網路中的自動化容量擴充套件服務出現錯誤,觸發了內部網路大量客戶端的意外行為,這導致連線活動大量湧現,使內部網路和 AWS 主網路之間的網路裝置不堪重負,並最終導致網路之間的通訊延遲。

這個錯誤甚至影響了亞馬遜修復該問題的能力,它阻止了運營團隊使用實時監控系統和內部控制,不得不使用日誌來查明發生了什麼。亞馬遜指出,服務啟動直到美國東部時間下午 4:34 才開始改進,問題在美國東部時間下午 5:22 完全解決。

瞭解到,由於亞馬遜的支援聯絡中心也在 AWS 網路上執行,因此客戶在中斷期間的七個小時內無法建立支援案例,亞馬遜服務健康儀表板也受到影響。

亞馬遜表示,它正在努力改進對中斷的響應,並計劃釋出服務健康儀表板的改進版本,如果發生中斷,應該可以幫助客戶及時收到更新。