今天早上許多群裡出現網站故障的討論,比如 cnblogs 全國訪問一片紅,一看原來是阿里雲又出故障了。

根據阿里雲健康看板狀態頁,北京時間凌晨 02:57 阿里雲發現故障,早上 8:11 分確認解析異常修復。 https://status.aliyun.com/#/eventDetail?eventId=27

這次爆炸的是 aliyuncs.com 域名,用過阿里雲服務的朋友們都知道,像物件儲存這種核心服務使用的域名都是 aliyuncs.com 的子域名。那麼域名解析故障的影響範圍可想而知。
而且因為有 DNS 快取的存在,實際上真正影響的時間會更長,也絕非只有這幾個小時。例如,截止到本文發出,老馮實測,阿里雲在海外的解析依然 “沒有恢復”,被解析到 sinkhole.shadowserver.org 。可能是因為 DNS 快取的原因。

有網友在微博上表示這次故障的原因是域名被人拿了,解析到 SS (Shadow Server)。

這裡提一嘴,Shadowserver 相當於賽博拖車廠

有客戶在 V 站上貼出了止損建議,評論也蠻有意思的。
阿里雲大早上來了個驚喜,被客戶叼炸了
https://v2ex.com/t/1136705#reply12


總之,這又是一場足以進入雲計算故障歷史的事件。這些以前看似 ”不可能出現“ 的問題,一次又一次真真切切的發生在大家面前。
老馮對此沒有更多評論,這件事本身就已經足夠魔幻了
雲計算泥石流專欄
網際網路技術大師速成班 馬工
門內的國企如何看門外的雲廠商 Leo
卡在政企客戶門口的阿里雲 馬工
你怎麼還在招聘DBA? 馬工
References
[1]
: https://status.aliyun.com/#/eventDetail?eventId=27