非常抱歉,今天下午14:40-15:00左右,web服務器突然雪崩似的出現(xiàn)CPU 100%問題,造成博客站點無法訪問(503)。由此給您帶來很大的麻煩,請您諒解。
在問題出現(xiàn)之前,博客站點運行著5臺web服務器,4臺4核8G的阿里云-計算型(原獨享)sn1系列II-服務器,1臺8核8G的阿里云c1型系列I服務器。本來今天下午并不是一周的訪問最高峰,這5臺服務器綽綽有余。但14:40左右開始,某種未知的情況引起這5臺服務器雪崩似的接連地出現(xiàn)CPU 100%。雪上加霜的是,倒下去的服務器沒能很快地站起來,被負載均衡拉黑,剩下的服務器在更高的負載下更加無喘息之機,也一臺接一臺的倒下、被拉黑。。。
雖然我們發(fā)現(xiàn)后很快通過阿里云彈性伸縮增加服務器,但無濟于事,彈性伸縮從開始增加服務器到服務器正常工作,大約需要5分鐘左右。等彈性伸縮的服務器起來后,已有服務器已基本都倒下,它們根本頂不住,上去就倒下。。。加了2臺,倒下2臺。
15:00左右,引發(fā)CPU 100%問題的未知情況消失,這7臺服務器的CPU也很快都恢復了正常。
就這樣,一場暴風雨在炎熱的周五下午襲擊了園子。
標簽: 故障公告