這是 OpenStack 實施經(jīng)驗分享系列的第 10 篇。
是軟件就會有 bug,OpenStack 也不例外,只要用它就一定會遇到故障。Troubleshooting(故障排除)是運(yùn)維 OpenStack 等開源項目的重要技能,遇到問題后一定要借助社區(qū)的力量定位、搜索、分析并解決問題。
下面 CloudMan 將分享一個真實的案例,還原當(dāng)時 Troubleshooting 的過程,希望能給大家一些啟發(fā)。
問題描述
某天客戶的 OpenStack 突然全線癱瘓:任何操作都無法正常完成,一直處于正在執(zhí)行狀態(tài),界面上也不報錯,就是無法完成操作。