VxRail:VMware ESXi 主機處於「無回應」狀態的故障診斷指南
Summary: 本文針對位於無回應 ESXi 主機上的虛擬機器 (VM) 問題提供解答,並協助將 ESXi 主機恢復至穩定狀態。
Symptoms
- ESXi 主機在 vSphere Web 用戶端上回報為 「無回應」。
- 無法從 vSphere Web Client 管理 ESXi 主機。
- 可針對 無回應的 ESXi 主機和其上的 VM 執行 Ping。
- 可透過 SSH 或在 ESXi 主機上執行的遠端桌面通訊協定 (RDP) 存取虛擬機器。
Cause
主機上的其中一個管理服務可能已故障或進入 「無回應」狀態。
這需要針對管理服務失敗或停止回應的原因進行根本原因分析。若要收集 vCenter Server 和 ESXi 主機記錄,請參閱 VMware 文章在讓叢集和 ESXi 進入穩定狀態之前收集 VMware ESXi 的診斷資訊。
有時這是不可能的,因為節點沒有回應收集日誌的命令。請檢閱本文「解決方案」一節中的資訊。如有必要,可透過 Dell 支援分析記錄以瞭解根本原因,以檢查問題是否與以下已知問題相關。
Resolution
正在重新開機 hostd 或 vpxa 在主機上,可能有助於恢復 vSphere 用戶端上的主機管理功能。這是使用 SSH 工作階段連接至 ESXi 主機來完成。
對 未回應 ESXi 主機的另一個回應是重新啟動 ESXi 主機上的管理代理程式。
services.sh 重新啟動命令。重新啟動主機的管理代理可能會影響正在運行的任務,包括對主機上的來賓虛擬機的影響。
您可以直接使用 CLI 或 SSH 工作階段至 ESXi (如果在發生問題之前已啟用 SSH),即可直接重新啟動 ESXi 主機的管理代理程式。
但是,若未啟用 SSH,則存取 BMC-iDRAC 連接埠可讓您存取 ESXi DCUI 畫面,並在畫面上將管理服務重新開機。請參閱 VMware 文章 1003490,以瞭解如何在 ESXi 中重新啟動管理代理程式。
DCUI 可能會沒有回應。使用 SSH 或 RDP 手動將 VM 關機,是將環境恢復至穩定狀態的唯一其他選項。完成後,請使用 BMC-iDRAC 電源控制,重新啟動 ESXi 主機電源,讓 ESXi 主機回到穩定狀態。
在 VM 關機後,立即將 VM 註冊至 穩定 主機,以減少 VM 在重新開機 未回應 ESXi 主機之前的停機時間。(之後,有問題的 ESXi 主機可以重新開機。)請遵循 VMware 文章 ,瞭解如何將虛擬機器 (VM) 註冊或新增至 vCenter Server
中的 vSphere 清查 如果您無法使用 SSH 或 RDP 關閉 VM 電源,請透過 ESXi 主機 SSH 工作階段終止 VM。請參閱 VMware 文章無法關閉 ESXi 主機中的虛擬機器電源
虛擬機器問題:
- 無法關閉 ESXi 主機中的虛擬機器電源 - 1014165
- 關閉 ESXi 主機上無回應虛擬機器的電源 - 1004340
- VM 在 vCenter Server 中顯示為無效或孤立 - 1003742
- VM 似乎正在多個 ESX/ESXi 伺服器上執行或註冊 - 319918
- 當無法使用 vSphere Client 管理主機時,從命令列開啟 VM 電源 - 1038043
- 排查已停止回應的虛擬機器 - 1007819