Dell VxRail:启用 vGPU 时虚拟机迁移失败

Summary: 启用 vGPU 时,虚拟机 (VM) 迁移失败。收到的错误是“当前连接的设备”'PCI 设备 0' 使用后备'grid_m60-2q',这是不可访问的。”

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

启用 vGPU 时,虚拟机迁移失败。

错误:
"Currently connected device" 'PCI device 0' uses backing 'grid_m60-2q', which is not accessible".
源 ESXi 节点使用 NVIDIA M60,目标 ESXi 节点使用 NVIDIA P40。驱动程序相同。他们有 vgpu.hotmigrate.enabled 根据需要启用。

请参阅 VMware 文章使用 vMotion 迁移 vGPU 虚拟机。 此超链接会将您带往 Dell Technologies 之外的网站。

Cause

这不受支持。

要在 ESXi 节点之间迁移虚拟机,它们必须使用相同类型的 GPU。请参阅 NVIDIA 文档 虚拟 GPU 软件用户指南此超链接会将您带往 Dell Technologies 之外的网站。

NVIDIA vGPU 软件支持配置了 vGPU 的虚拟机的 VMware vSphere vMotion。VMware vSphere vMotion 使您能够将正在运行的虚拟机从一台物理主机移动到另一台主机,几乎没有中断或停机时间。对于配置了 vGPU 的虚拟机,vGPU 会随虚拟机一起迁移到另一台主机上的 NVIDIA GPU。两台主机上的 NVIDIA GPU 必须属于同一类型

如果存在不同类型的 GPU,则会有不同的配置文件。配置文件“grid_m60-2q”不会位于目标 GPU P40 上。

Resolution

用户必须确保源和目标 ESXi 节点使用相同类型的 GPU。

提醒:如果使用相同类型的 GPU,请查看 NVIDIA 虚拟 GPU 软件发行说明 此超链接会将您带往 Dell Technologies 之外的网站。以了解其他限制。

vGPU 迁移(包括 vMotion 和暂停-恢复)仅在部分受支持的 GPU 上受支持。请参阅 VMware vSphere Hypervisor (ESXi) 版本和来宾操作系统。

已启用以下任何 NVIDIA CUDA 工具包功能的虚拟机将禁用 vGPU 迁移:
  • 统一内存
  • 调试
  • 分析器

Affected Products

VxRail Appliance Family, VxRail Appliance Series
Article Properties
Article Number: 000224160
Article Type: Solution
Last Modified: 07 Jun 2024
Version:  2
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.