VxRail:将主机置于维护模式时,具有 vGPU 的虚拟机迁移失败
Summary: 将主机置于维护模式时,具有 vGPU 的虚拟机迁移失败
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Symptoms
进入维护模式时,DRS 可以自动将虚拟机迁移到群集中的其他兼容主机。
但是,当具有 vGPU 虚拟机的 ESXi 主机进入维护模式时,“进入维护模式”任务无法完成,并出现故障事件:
但是,当具有 vGPU 虚拟机的 ESXi 主机进入维护模式时,“进入维护模式”任务无法完成,并出现故障事件:
DRS failed to generate a vMotion recommendation for a virtual machine on a host entering Maintenance Mode.
Cause
当 ESXi 主机由于长时间虚拟机 Stun Times 中的工作负载中断而进入维护模式时,DRS 不会自动迁移 vGPU 虚拟机。
Resolution
通过手动迁移 ESXi 主机的 vGPU 虚拟机,手动修复此问题。
解决 方案:
在 vCenter Server 7.0 Update 3f 和 vSphere 7.0.3 或更高版本中,添加了 DRS 群集高级选项覆盖,为虚拟基础架构管理员提供了一种选择加入的方式,以自动清点 vGPU 虚拟机。
解决 方案:
在 vCenter Server 7.0 Update 3f 和 vSphere 7.0.3 或更高版本中,添加了 DRS 群集高级选项覆盖,为虚拟基础架构管理员提供了一种选择加入的方式,以自动清点 vGPU 虚拟机。
- 选项:VgpuMMAutomationTimeoutSecs
值:-1
上述覆盖随附以下行为更改:
- 在 100 秒 vMotion 超时情况下,自动清点 vGPU 虚拟机。
- 在切换期间,vGPU 虚拟机 Stun Time 可能会超过 10 秒(具体取决于网络带宽和 vGPU 配置文件的大小)。
- 虚拟机的清点已序列化,以避免网络争用。
要求:
- DRS 群集中的额外 vGPU 主机容量
示例:进入维护模式的主机的重复主机配置
- 主机上的虚拟机进入维护模式时未报告兼容性问题。
Additional Information
请参阅 VMware 文章 vGPU Virtual Machine automated migration for Host Maintenance Mode in a DRS Cluster (88271)

Affected Products
VxRail, VMWare Cloud on Dell EMC VxRail E560F, VMWare Cloud on Dell EMC VxRail E560N, VxRail Appliance Family, VxRail Appliance Series, VxRail G Series Nodes, VxRail D Series Nodes, VxRail E Series Nodes, VxRail P Series Nodes, VxRail S Series NodesProducts
XC Core Systems, XC Series Appliances, VxRail Software, VxRail V Series Nodes, VxRail VD Series NodesArticle Properties
Article Number: 000216497
Article Type: Solution
Last Modified: 19 Aug 2023
Version: 2
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.