這是 OpenStack 實(shí)施經(jīng)驗(yàn)分享系列的第 10 篇。
是軟件就會(huì)有 bug,OpenStack 也不例外,只要用它就一定會(huì)遇到故障。Troubleshooting(故障排除)是運(yùn)維 OpenStack 等開源項(xiàng)目的重要技能,遇到問(wèn)題后一定要借助社區(qū)的力量定位、搜索、分析并解決問(wèn)題。
下面 CloudMan 將分享一個(gè)真實(shí)的案例,還原當(dāng)時(shí) Troubleshooting 的過(guò)程,希望能給大家一些啟發(fā)。
問(wèn)題描述
某天客戶的 OpenStack 突然全線癱瘓:任何操作都無(wú)法正常完成,一直處于正在執(zhí)行狀態(tài),界面上也不報(bào)錯(cuò),就是無(wú)法完成操作。