重點一:Cloudflare大規模故障在18日晚間造成多起服務中斷服務,官方表示「事件已解決」,多數網站恢復。
重點二:根據國際網路監測平台Downdetectot統計,包括社群平台X、ChatGPT、Spotify等都一度受到故障影響,相繼出現「內部伺服器錯誤」(HTTP 500 Internal Server Error)與封鎖誤判。
重點三:Cloudflare 狀態頁更新多次,歷經「調查中、工具部分恢復」到宣告修復,截至台灣時間18日晚間11時許,官方表示服務「看似已恢復」,目前持續監控中。
全球重要網路基礎設施廠商Cloudflare於11月18日晚間爆發全球性網路故障,導致數以千計大型網站和應用程式陷入癱瘓。
此次故障嚴重衝擊依賴Cloudflare的各類重點服務, 包括社群平台X、ChatGPT、Spotify、雲端平台AWS、英雄聯盟、Google、Canva、Azure等,前端頁面都一度受到影響,出現大規模連線失敗及系統錯誤,衝擊範圍遍及美國、歐洲至亞太等多地。
不少用戶在Downdetector反映無法登入網站、網頁元件遺失,甚至稱「全世界都受到影響」。
至於Cloudflare當機,為何一次對這麼多平台有影響?原因在於Cloudflare是大量網站的「中介層」(CDN、DNS、安全與邊緣運算),因此其全球網路一出問題,經它轉送或解析的流量就會同時受影響。
白話來說,很多網站把自己連到Cloudflare,請求會先經過它的網路再回到原站。Cloudflare提供加速的CDN、擋攻擊的WAF與DDoS防護、幫你「找到網站地址」的DNS,甚至在邊緣幫你跑程式。所以它其實是網路上的大型「中介層」。
一旦這個中介層在某一環節出問題(比如路由、代理或邊緣服務故障),經過它的大量網站就一起出現500錯誤、連不上或變超慢,比喻來說就是「經過這個交流道的車」都會受影響,實際上就是很多平台一起當機。
Cloudflare官方怎麼說?
Cloudflare 目前已迅速於系統狀態網站公告本次全球當機事件。依照最新狀態,官方強調「我們認為事件已解決」,但部分客戶可能仍遇到登入或使用 Cloudflare 控制面板的相關問題,「正在努力修復,並持續監控問題。」
回顧官方狀態消息,修復事件的關鍵時間點如下(以下皆以UTC協調世界時為準):
- 13:09 UTC:已定位問題並開始實施修復。
- 13:13 UTC:Access 與 WARP 錯誤率回到事件前水準;倫敦的 WARP 使用重新啟用。
- 14:34 UTC:已部署變更,儀表板服務恢復,但廣泛應用服務仍在修復中。
- 14:42 UTC:修復已實施,事件「相信已解決」,進入監控。
- 14:57 UTC:仍有部分客戶登入/使用儀表板出現問題,持續處理與監控。
值得慶幸的是,大規模當機時間為台灣時間深夜,對於廣大上班族群來說應無太大衝擊。不少網友在Threads上發文指出「網路上還有活人嗎?」、「那我今晚可以不用工作了嗎?」也有網友表明連線正常,「但是我不想工作啦!」
資料來源:Cloudflare、Downdetector
本文初稿為AI編撰,整理.編輯/ 李先泰
