PowerFlex:如何检测永久性内存 (NVDIMM) 是否有坏块
Summary: PowerFlex 的精细粒度存储池使用永久性内存 (PMEM)(也称为非易失性 DIMM (NVDIMM))来加速和压缩数据。 这些 DIMM 可能像常规 RDIMM 一样具有坏块,并且必须像任何其他类型的磁盘一样定期监控故障。 在早期版本中,SDS 设备仅在访问相关部分时检测坏块,并且由于 SDS 故障而导致读取失败。 对于较早版本,可以主动遵循以下步骤来检测具有坏块的 NVDIMM 并更换它们。 注意:由于我们在产品中具有固有的冗余,这些数据块的数据将备份到另一个节点上,如果发生故障,SDS 将出现故障,其他 SDS 将为 IO 提供服务。 ...
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Instructions
此流程仅适用于基于 Linux 的操作系统。
提醒:ESXi 上基于 VMware 的实施保持了检查设备是否有故障的功能,并且无法从 PowerFlex 存储虚拟机查询,如果 NVDIMM 发生故障,NVRAM 数据存储区将离线,存储虚拟机将关闭电源,并且在更换 NVDIMM 之前无法启动。
如何检测Linux作系统上的坏块:
1.在具有 NVDIMM 的每个主机上使用 shell 运行以下命令:
注意:建议的频率为每天一次。
ndctl list --media-errors
具有故障的 DAX 设备的命令输出示例。
在以下输出部分中,带有 dax 1.0 的命名空间 1.0 有 13 个坏块,必须进行更换。
[
{
"dev":"namespace1.0",
"mode":"devdax",
"map":"dev",
"size":62914560,
"uuid":"47072fee-1447-4e04-b4ca-f28e2c03af80",
"chardev":"dax1.0",
"align":4096,
"badblock_count":13,
"badblocks":
2.关联 PowerFlex 存储池中使用的 DAX 设备:
一个。要检索配置到群集中每个存储池的所有存储设备的列表,首先必须登录:
scli --login --username <NAME> --password <PASSWORD>
b. 查看已配置到每个存储池的设备的列表:
for SNAME in $(scli --query_all_sds | grep ID: | awk '{print $5}'); do echo $SNAME ; scli --query_sds --sds_name $SNAME | grep -E "Path|Pool" ; done
对于群集中的每个 SDS,应该会出现类似于以下内容的输出:
SDS_Node1 Storage Pool information (total of 2 Storage Pools): 1: Storage Pool: default inflight requests factor: 115, inflight bandwidth factor 115 2: Storage Pool: fg_1 inflight requests factor: 115, inflight bandwidth factor 115 1: Name: N/A Path: /dev/sdv Original-path: /dev/sdv ID: ddfeb59d00030000 Storage Pool: default, Capacity: 1786 GB, State: Normal 2: Name: N/A Path: /dev/sdk Original-path: /dev/sdk ID: ddfedc3100030005 Storage Pool: fg_1, Capacity: 894 GB, State: Normal 3: Name: N/A Path: /dev/sdl Original-path: /dev/sdl ID: ddfedc3200030006 Storage Pool: fg_1, Capacity: 894 GB, State: Normal 4: Name: N/A Path: /dev/sdm Original-path: /dev/sdm ID: ddfedc3300030007 Storage Pool: fg_1, Capacity: 894 GB, State: Normal 5: Name: N/A Path: /dev/sdn Original-path: /dev/sdn ID: ddfedc3400030008 Storage Pool: fg_1, Capacity: 894 GB, State: Normal 6: Name: N/A Path: /dev/svm_sdo Original-path: /dev/svm_sdo ID: ddfedc3500030009 Storage Pool: fg_1, Capacity: 894 GB, State: Normal 7: Name: N/A Path: /dev/svm_sdp Original-path: /dev/svm_sdp ID: ddfedc360003000a Storage Pool: fg_1, Capacity: 894 GB, State: Normal 1: Name: N/A Path: /dev/dax0.0 Original-path: /dev/dax0.0 ID: ddfedc2100030001 Acceleration Pool: ac_1, Capacity: 15.7 GB (16052 MB), Used: 1.3 GB (1372 MB), State: Normal 2: Name: N/A Path: /dev/dax1.0 Original-path: /dev/dax1.0 ID: ddfedc2200030002 Acceleration Pool: ac_1, Capacity: 15.7 GB (16052 MB), Used: 1.3 GB (1372 MB), State: Normal 3: Name: N/A Path: /dev/dax2.0 Original-path: /dev/dax2.0 ID: ddfedc2300030003 Acceleration Pool: ac_1, Capacity: 15.7 GB (16052 MB), Used: 686.0 MB (702464 KB), State: Normal 4: Name: N/A Path: /dev/dax3.0 Original-path: /dev/dax3.0 ID: ddfedc2400030004 Acceleration Pool: ac_1, Capacity: 15.7 GB (16052 MB), Used: 686.0 MB (702464 KB), State: Normal
这意味着此节点具有加速池ac_1使用的 DAX 设备 /dev/dax1.0,该设备具有坏块,必须更换。
PowerFlex 支持指导
- 如果仅在一个主机上发现这种情况,请继续从 PowerFlex 系统中删除 DAX 设备,并拨打故障 PMEM\NVDIMM 设备 FRU(现场更换单元)的服务电话。
- Dell Technologies 建议在计划的维护时段内尽快更换 PMEM\NVDIMM 设备。
- R640\R740xd\R840 现场可更换单元指南中记录了更换故障 NVDIMM 的过程,相关章节是:“更换基于 Linux 的 VxFlex 就绪型节点 R640\R740xd\R840 服务器中的 NVDIMM。”
- 如果您在同一个精细粒度存储池中的不同节点上有多个设备存在坏块,则拨打 PowerFlex 支持人员的服务电话,以验证数据稳定性。
Affected Products
PowerFlex SoftwareArticle Properties
Article Number: 000185583
Article Type: How To
Last Modified: 11 Nov 2025
Version: 8
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.