PowerFlex 4.x 如何更换 HCI 节点中的 NVMe RDM

Summary: 本文逐步介绍如何更换 NVMe 设备,以及如何在 SVM 中执行 RDM 配置以正确映射到 ESXi 主机

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

步骤 

 

1- 找到驱动器的属性
使用 iDRAC 实用程序收集有关 NVMe 驱动器的信息。

  1. 从 Internet 浏览器中,转至 http://< iDRAC_IP_address>
  2. DELL Console Login 窗口中,输入用户名和密码,然后单击 Login此时将显示 Integrated Dell Remote Access Controller 屏幕。
  3. 在导航窗格中,选择存储>概览,然后单击物理磁盘。iDRAC 显示服务器上安装的物理驱动器的列表。
  4. “状态 ”列中,搜索状态为 “故障 ”的驱动器。
  5. 在 NVMe 信息表中记录驱动器 的名称插槽编号和序列号

 

驱动器名称驱动器插槽驱动器序列行。

 

 

 

2- 收集超融合节点上的SDS信息

使用 PowerFlex Manager 平台 (PFMP) 收集有关超融合节点上具有故障 NVMe 驱动器的 PowerFlex SDS 的信息。

  1. 在网页浏览器中,输入 PFMP IP 地址,然后以管理员用户身份登录。
  2. 单击 Block > SDSs,然后选择 NVMe 出现故障的受影响 SDS 节点
  3. 在右侧窗格中,单击所选 SDS 下的Devices
  4. 记下出现故障的设备路径和 SP 名称 

    例如,

     SSD => /dev/sdX

    NVMe => /dev/nvmeXn1 
  5.  

    对于使用 CloudLink 加密的设备,设备路径显示为:

    SSD => /dev/mapper/svm_sdX

    NVMe => /dev/mapper/nvmeXn1 
  6. 使用 SSH 连接到 ESXi 主机
  7. 运行以下命令以查找故障设备 的名称 :  
    esxcli nvme device list

    将显示类似于以下内容的输出:


     

  8. 在设备列表的状态列中 ,故障设备显示为离线。

    记下设备名称,例如:vmhba10 
  9. 找到设备 vmhbaX 的适配器并查找序列号:
    esxcli nvme device get -A vmhbaX | grep -i serial
    例如:
    esxcli nvme device get -A vmhba10 | grep -i serial

    输出会显示驱动器的详细信息,包括序列号。


     

 

 

3- 超融合节点上的 PowerFlex移除故障NVMe驱动器

  1. 如果您尚未登录 PFMP,请执行此作。
  2. 在 PFMPGUI 左侧窗格中,单击 Block >SDSs >,从右侧图表上的设备超链接中列出 SDS 设备 
  3. 选中故障设备的复选框。确保您选择的存储设备与您在步骤 2 中记下的存储设备相同
  4. 在上部菜单中,单击More ActionsRemove>。

  5. RemoveDevice对话框中,单击Remove进行确认。

    1. 如果使用 CloudLink 对故障驱动器进行加密,请取消对设备进行加密,或者在未使用 CloudLink 时跳过此步骤:
      1. 使用 SSH 连接到节点。
      2. 运行以下命令:
  6. svm -y erase /dev/nvmeXn1

    其中 X 是数字驱动器标识符

 

4- 从 SVM 中删除故障设备的 RDM

  1. 重新登录 vCenter。
  2. 清单窗格中,选择主机群集
  3. 在导航窗格中,选择受影响的 ESXi HCI 服务器。
  4. 配置选项卡中,选择存储>存储设备以查看主机上的存储设备。
  5. 查找运行状态为 Dead 或 Error的 NVMe 设备。(有关详细信息,请参阅下面的“关联 ESXi 服务器上的设备插槽和作系统路径”。
  6. Device Details >Properties 选项卡中,找到设备的 PowerFlex 驱动器名称和 NVMe 标识符,并将其记下。

  7.  

    在导航窗格中,右键单击位于受影响的 HCI ESXi 主机上的 SVM ,然后选择 Edit Settings

    编辑设置 窗口中, 将显示虚拟硬件 选项卡。SVM 详细信息包括硬盘驱动器。每个变暗的硬盘都是 RDM 设备。

  8. 展开每个 RDM 的属性。

    物理 LUN 字段中,查找您在上一步中获得的 NVMe 设备的标识符值。

     

     

 

  1. 如果标识符值显示为物理 LUN 值的一部分,则这是故障设备。否则,请选择 Manage other disks 以查看 SVM 上的其他硬盘并检查其 物理 LUN 值,然后单击 Manage Path 以识别故障设备。

     

  2. 使用物理 LUN 值确定具有故障设备的硬盘后,单击硬盘右侧的 X 以删除设备。

     


     

 

 

 

 

 

 

 

 

选择Delete files fromdatastore,然后单击 Close

 

 

 

5- 使用运行状况良好的新磁盘以物理方式更换出现故障的 NVMe 磁盘 

停止PowerFlex节点上的NVMe设备活动

  • 登录到 iDRAC。
  • 在主菜单上,选择 配置>存储配置
  • 控制器 字段中,根据服务器型号从列表中选择相应的控制器:
    • PowerFlex R650 节点:CPU
    • PowerFlex R750 节点:PCIe 扩展器
    • PowerFlex R6525 节点:PCIe 扩展器

 

  • 此时将打开一个新页面,其中包含与该控制器关联的物理驱动器列表。
  • 选择需要更换的物理驱动器,然后单击 准备卸下 >立即应用

 

 

现在,您可以从服务器中以物理方式卸下出现故障的 NVMe 设备。

 

6- 准备 NVMe 设备并将其添加到ESXi服务器上PowerFlex系统

使用以下任务通过关联设备插槽和基于 ESXi 的服务器上的作路径,准备 NVMe 设备以供使用,并将其添加到 PowerFlex 系统。

  1. 从 Internet 浏览器中,转到 http:// <iDRAC_IP_address>
  2. DELL Console Login 窗口中,键入用户名和密码,然后单击 Login
  3. 从主菜单中,选择存储>概览,然后单击物理磁盘。iDRAC 显示服务器上安装的物理驱动器的列表。
  4. 找到插槽编号与刚更换的驱动器插槽相匹配的行。
  5. 单击左列中的加号以显示驱动器的高级属性。
  6. 搜索并记下新驱动器的 序列号 。例如:50000396DC89A872

提醒:如果 iDRAC 未显示驱动器的序列号,则更换驱动器可能安装不正确。

  1. 使用 SSH 登录到 SVM
  2. 运行以下命令以检查作系统设备路径:
ls -l /dev/disk/by-id/

 

将显示类似于以下内容的输出:

 

  1. 找到末尾带有 sdX 的行,然后记下 SFFxxxxx编号。
  2. 运行以下命令以检查更换设备的状态。
esxcli nvme device list

将显示类似于以下内容的输出:

  1. 可选 )运行以下命令以检查更换设备的固件版本:
esxcli nvme device get -A vmhbaX | grep -i Revision

其中 vmhbaX 是新 NVMe 设备的名称。

例如,对于上一步的图像中显示的更换设备,命令为:

esxcli nvme device get -A vmhba10 | grep -i Revision

输出类似于以下内容,其中包含实际固件版本:

 

 

验证固件版本是否符合 RCM 或 IC 

  1. 找到设备 vmhbaX 的适配器并查找序列号:
esxcli nvme device get -A vmhbaX | grep -i serial

例如:

esxcli nvme device get -A vmhba10 | grep -i serial

输出会显示驱动器的详细信息,包括序列号。

 

 

 

 

 

7 -(可选)加密PowerFlex 节点的新NVMe设备,如果不使用 Cloudlink,则跳过此步骤

如果您更换的 NVMe 驱动器是使用 CloudLink 加密的,请执行以下步骤来加密新的 NVMe 驱动器。如果故障驱动器未加密,请跳过此任务。

  1. 使用 SSH 连接到 SDS 节点。
  2. 运行以下命令以加密新驱动器:
svm encrypt /dev/nvme<xxx>

其中 NVMe<XXX>是您刚刚更换的设备的名称。例如:

svm encrypt /dev/nvmeXn1

大约 60 秒后,系统将对新设备进行加密。

  1. 运行以下命令以验证新设备位置:
svm status

应显示类似于以下内容的输出:

State: Connected (server 192.168.150.32)
Group: MG-12 Policy: Manual
AES-NI HW acceleration: Yes
Volumes:
/             unencrypted
/home         unencrypted


Devices:
/dev/nvme0n1    encrypted       (sds	SN:9486948577248625  /dev/mapper/svm_nvme0n1)
/dev/nvme10n1	encrypted	(sds	SN:948694857725248625/dev/mapper/svm_nvme10n1)
/dev/nvme11n1	encrypted	(sds	SN:948694857725258625/dev/mapper/svm_nvme11n1)
/dev/nvme12n1	encrypted	(raw	SN:948694857725268625/dev/mapper/svm_nvme12n1)
/dev/nvme13n1	encrypted	(raw	SN:948694857725278625/dev/mapper/svm_nvme13n1)
/dev/nvme14n1	encrypted	(raw	SN:948694857725288625/dev/mapper/svm_nvme14n1)
/dev/nvme15n1	encrypted	(raw	SN:948694857725298625/dev/mapper/svm_nvme15n1)
/dev/nvme16n1	encrypted	(raw	SN:948694857725308625/dev/mapper/svm_nvme16n1)
/dev/nvme17n1	encrypted	(raw	SN:948694857725318625/dev/mapper/svm_nvme17n1)

 

  1. 找到 /dev/nvmeX 设备并确保其已加密,然后在驱动器信息表中记录其新设备路径。

例如:

/dev/mapper/svm_nvme17n1

 

 

8 - 将设备添加到超融合节点上的 PowerFlex 系统

将新的 NVMe 作为 RDM 映射到 SVM,然后将其添加到 PowerFlex 系统。

 

  1. 打开与受影响的 HCI ESX 主机的 SSH 会话。
  2. 使用以下命令列出连接到 ESXi 主机的磁盘:
 # ls -l /vmfs/devices/disks
  1. 从列表中,标识要配置为 RDM 的本地设备并复制设备名称。

    注意:设备名称可能以 t10 为前缀。并看起来像 :t10。F405E46494C4540046F455B64787D285941707D203F45765
  2. 要将设备配置为 RDM 并将 RDM 指针文件输出到所选目标,请运行以下命令:
 # vmkfstools -z /vmfs/devices/disks/ /vmfs/volumes///_x.vmdk

例如:

 # vmkfstools -z /vmfs/devices/disks/t10.F405E46494C4540046F455B64787D285941707D203F45765 /vmfs/volumes/Datastore2/SVM-1/svm-1_1.vmdk

提醒:新创建的 RDM 指针文件的大小看起来与它映射到的原始设备的大小相同;这是一个虚拟文件,不占用任何存储空间。
 

  1. 创建 RDM 指针文件后,使用 vSphere Client 将 RDM 连接到虚拟机:
     
  1. 在 vSphere Client 中,重新扫描 ESXi 存储以显示添加的设备。
  2. 选择受影响的 HCI ESXi 主机 > 存储适配器 >重新扫描存储

 

 

  1. 右键单击位于受影响的 HCI ESXi 主机上的 SVM ,然后选择 Edit Settings
  2. 在右上角,选择 ADD NEW DEVICE > Existing Hard Disk

  1. 选择Hard Disk。
  2. 选择 Use an existing virtual disk。
  3. 浏览到您在步骤 4 中保存 RDM 指针的目录,选择 RDM 指针文件,然后单击 下一步
  4. 选择要将磁盘连接到的虚拟 SCSI 控制器,然后单击下一步
  5. 单击“Finish”(完成)
     

现在,您应该会在虚拟机清单中看到新硬盘为“Mapped Raw LUN”

 

 

 

Affected Products

ScaleIO
Article Properties
Article Number: 000334185
Article Type: How To
Last Modified: 19 Jun 2025
Version:  2
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.