非常抱歉,今天下午14:20-14:55期間,由于同一個負載均衡中的2臺服務器都出現(xiàn)CPU 100%問題,造成博客后臺無法正常訪問,由此給您帶來了很大很大的麻煩,請您諒解。
博客后臺是CPU消耗很低的應用,這2臺服務器通常CPU占用在5%左右,之前從來沒有出現(xiàn)CPU 100%的問題(所以連云監(jiān)控都沒添加CPU監(jiān)控報警)。這次問題很突然,我們發(fā)現(xiàn)問題后,遠程連接不上服務器,只能通過阿里云控制臺重啟服務器,重啟后立馬恢復正常。
對于問題的具體原因,目前還沒找到,我們正在進一步排查,也反饋給了阿里云,阿里云也在排查。
對于這次故障,我們會吸取教訓,采取改進措施:
1)加強監(jiān)控
2)采用 Docker 進行容器化部署:在更多服務器上用更多容器運行,避免2臺服務器同時出問題引發(fā)故障,但這要等我們完成博客后臺向 ASP.NET Core 的遷移。