近日,亞馬遜 AWS(亞馬遜網絡服務)在美國東部 us-east-1區域遭遇嚴重故障,導致全球範圍內的數百個互聯網服務陷入癱瘓,甚至連知名的 ChatGPT 也未能倖免。這次宕機事件宛如 “地震”,使得許多日常使用的應用和網站無法訪問。
根據故障追蹤平臺 Downdetector 的數據,當天的故障報告數量超過了650萬份,顯示出事件的嚴重性。受影響的服務不僅包括開發者常用的 Docker 和 npm,還涉及到視頻會議工具 Zoom 和 Slack、社交媒體 Reddit、流媒體平臺 Netflix 和 Disney + 等。更令人無奈的是,用戶在家中點餐、打車,甚至搭乘航班時也都遭遇了麻煩。

這次故障的主要原因是 AWS 的 DNS(域名系統)解析問題,以及一個監控子系統出現異常,導致網絡連接不穩定。這一故障發生在 AWS 最早設立的 us-east-1區域,該區域不僅承載着大量企業的核心服務,還負責許多全球控制面服務。由於其重要性,us-east-1的宕機對其他區域的服務造成了連鎖反應。
用戶們在社交媒體上紛紛吐槽,一些網友用幽默的方式調侃馬斯克的社交平臺 X 未受影響,成爲討論的 “避風港”。然而,對於那些依賴於 AWS 的服務用戶來說,這次宕機事件無疑是一場災難。不僅工作無法進行,生活中的基本服務也遭到了波及。
此事件再一次揭示了互聯網基礎設施的脆弱性。雖然大型雲服務平臺提升了網絡的穩定性和安全性,但集中化的服務架構使得小故障也可能導致嚴重後果。專家建議,開發者應考慮採用多區域部署的方式,以減少因單點故障帶來的影響。
雖然這次故障令人沮喪,但也給我們敲響了警鐘:在享受互聯網便利的同時,我們也必須思考如何提高系統的彈性,以應對不可預見的風險。
