非常抱歉,今天下午14:40-15:00左右,web服務(wù)器突然雪崩似的出現(xiàn)CPU 100%問(wèn)題,造成博客站點(diǎn)無(wú)法訪問(wèn)(503)。由此給您帶來(lái)很大的麻煩,請(qǐng)您諒解。
在問(wèn)題出現(xiàn)之前,博客站點(diǎn)運(yùn)行著5臺(tái)web服務(wù)器,4臺(tái)4核8G的阿里云-計(jì)算型(原獨(dú)享)sn1系列II-服務(wù)器,1臺(tái)8核8G的阿里云c1型系列I服務(wù)器。本來(lái)今天下午并不是一周的訪問(wèn)最高峰,這5臺(tái)服務(wù)器綽綽有余。但14:40左右開(kāi)始,某種未知的情況引起這5臺(tái)服務(wù)器雪崩似的接連地出現(xiàn)CPU 100%。雪上加霜的是,倒下去的服務(wù)器沒(méi)能很快地站起來(lái),被負(fù)載均衡拉黑,剩下的服務(wù)器在更高的負(fù)載下更加無(wú)喘息之機(jī),也一臺(tái)接一臺(tái)的倒下、被拉黑。。。
雖然我們發(fā)現(xiàn)后很快通過(guò)阿里云彈性伸縮增加服務(wù)器,但無(wú)濟(jì)于事,彈性伸縮從開(kāi)始增加服務(wù)器到服務(wù)器正常工作,大約需要5分鐘左右。等彈性伸縮的服務(wù)器起來(lái)后,已有服務(wù)器已基本都倒下,它們根本頂不住,上去就倒下。。。加了2臺(tái),倒下2臺(tái)。
15:00左右,引發(fā)CPU 100%問(wèn)題的未知情況消失,這7臺(tái)服務(wù)器的CPU也很快都恢復(fù)了正常。
就這樣,一場(chǎng)暴風(fēng)雨在炎熱的周五下午襲擊了園子。
標(biāo)簽: 故障公告