VxRail:处于“无响应”状态的 VMware ESXi 主机的故障处理指南
Summary: 本文提供了驻留在无响应的 ESXi 主机上的虚拟机 (VM) 问题的答案,并帮助将 ESXi 主机恢复到稳定状态。
Symptoms
- ESXi 主机在 vSphere Web Client 上报告 为无响应。
- 无法从 vSphere Web Client 管理 ESXi 主机。
- 能够 ping 通 无响应的 ESXi 主机及其上的虚拟机。
- 能够通过 ESXi 主机上运行的 SSH 或远程桌面协议 (RDP) 访问虚拟机。
Cause
主机上的某个管理服务可能已发生故障或进入 无响应状态。
这需要分析管理服务失败或停止响应的原因的根本原因。通过参阅 VMware 文章在将群集和 ESXi 置于稳定状态之前收集 VMware ESXi 的诊断信息,收集 vCenter Server 和 ESXi 主机日志。
有时这是不可能的,因为节点没有响应收集日志的命令。请查看本文“解决方案”部分中的信息。如有必要,可以通过戴尔支持分析日志,以了解根本原因,并检查以下已知问题是否与问题相关。
Resolution
正在重新启动” hostd 或 vpxa 在主机上可帮助恢复 vSphere Client 上的主机可管理性。这使用与 ESXi 主机的 SSH 会话完成。
对 无响应 ESXi 主机的另一种响应是重新启动 ESXi 主机上的管理代理程序。
services.sh restart 命令。重新启动主机的管理代理程序可能会影响正在运行的任务,包括对主机上的来宾虚拟机的影响。
使用 CLI 或与 ESXi 的 SSH 会话直接重新启动 ESXi 主机的管理代理(如果在问题发生之前启用了 SSH)。
但是,如果未启用 SSH,则访问 BMC-iDRAC 端口可以访问 ESXi DCUI 屏幕,在该屏幕中可以重新启动管理服务。有关在 ESXi 中重新启动管理代理,请参阅 VMware 文章 1003490。
DCUI 可能会变得无响应。使用 SSH 或 RDP 手动关闭虚拟机是使环境恢复到稳定状态的唯一其他选项。完成后,使用 BMC-iDRAC 电源控制,重启(重新启动)ESXi 主机,以使 ESXi 主机进入稳定状态。
关闭虚拟机后直接将虚拟机注册到 稳定 主机,从而在重新启动 无响应的 ESXi 主机之前减少虚拟机的停机时间。(之后,可以重新启动有问题的 ESXi 主机。)请遵循有关如何 在 vCenter Server
中将虚拟机 (VM) 注册或添加到 vSphere 清单上的 VMware 文章 如果您无法使用 SSH 或 RDP 关闭虚拟机,请通过 ESXi 主机 SSH 会话终止虚拟机。请参阅 VMware 文章无法关闭 ESXi 主机中的虚拟机
虚拟机问题:
- 无法关闭 ESXi 主机中的虚拟机 — 1014165
- 关闭 ESXi 主机上无响应的虚拟机的电源 - 1004340
- 虚拟机在 vCenter Server 中显示为无效或孤立 - 1003742
- 虚拟机似乎正在多个 ESX/ESXi 服务器上运行或注册 - 319918
- 当无法使用 vSphere Client 管理主机时,从命令行打开虚拟机 — 1038043
- 对已停止响应的虚拟机进行故障处理 - 1007819