PowerFlex: Cómo detectar si la memoria persistente (NVDIMM) tiene bloques defectuosos

Summary: Los pools de almacenamiento de granularidad fina de PowerFlex utilizan memoria persistente (PMEM), también conocida como DIMM no volátil (NVDIMM), para acelerar y comprimir los datos. Estos DIMM pueden tener bloques dañados al igual que los RDIMM normales y se deben monitorear periódicamente para detectar fallas como cualquier otro tipo de disco. En una versión anterior, el dispositivo SDS solo detectará el bloque defectuoso cuando acceda a la sección pertinente y fallará la lectura fallando el SDS. Para la versión anterior, se pueden seguir los siguientes pasos proactivamente para detectar NVDIMM con bloques defectuosos y reemplazarlos. Nota: Dado que tenemos redundancia inherente en el producto, los datos de estos bloques se respaldan en otro nodo y, en caso de falla, el SDS fallará y los otros SDS brindarán servicio a la I/O. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

Este procedimiento solo es aplicable a los SO basados en Linux.

Nota: La implementación basada en VMware en ESXi mantiene la capacidad de comprobar si el dispositivo tiene fallas o no y no se puede consultar desde la VM de almacenamiento de PowerFlex. En caso de una falla de NVDIMM, el almacén de datos de NVRAM estará offline y la VM de almacenamiento se apagará y no podrá arrancar hasta que se reemplace el NVDIMM.

Cómo detectar los bloques defectuosos en el sistema operativo Linux:

1. Ejecute el siguiente comando mediante el shell en cada host que tenga un NVDIMM:
NOTA: La frecuencia recomendada es una vez al día.

ndctl list --media-errors

Ejemplo de la salida del comando para un dispositivo DAX que tiene fallas.

En la siguiente parte de la salida, el espacio de nombres 1.0 con DAX 1.0 tiene 13 bloques defectuosos y se debe reemplazar.

[
  {
    "dev":"namespace1.0",
    "mode":"devdax",
    "map":"dev",
    "size":62914560,
    "uuid":"47072fee-1447-4e04-b4ca-f28e2c03af80",
    "chardev":"dax1.0",
    "align":4096,
    "badblock_count":13,
    "badblocks":

2. Correlacionar el dispositivo DAX que está en uso en un Pool de almacenamiento PowerFlex:

un. Para recuperar una lista de todos los dispositivos de almacenamiento configurados en cada pool de almacenamiento del clúster, primero debemos iniciar sesión:

scli --login --username <NAME> --password <PASSWORD>

b. Vea la lista de dispositivos configurados en cada Pool de almacenamiento:

for SNAME in $(scli --query_all_sds | grep ID: | awk '{print $5}'); do echo $SNAME ; scli --query_sds --sds_name $SNAME | grep -E "Path|Pool" ; done

Debería aparecer un resultado similar al siguiente para cada SDS del clúster:

SDS_Node1
Storage Pool information (total of 2 Storage Pools):
1: Storage Pool: default inflight requests factor: 115, inflight
bandwidth factor 115
2: Storage Pool: fg_1 inflight requests factor: 115, inflight bandwidth
factor 115
1: Name: N/A Path: /dev/sdv Original-path: /dev/sdv ID: ddfeb59d00030000
Storage Pool: default, Capacity: 1786 GB, State: Normal
2: Name: N/A Path: /dev/sdk Original-path: /dev/sdk ID: ddfedc3100030005
Storage Pool: fg_1, Capacity: 894 GB, State: Normal
3: Name: N/A Path: /dev/sdl Original-path: /dev/sdl ID: ddfedc3200030006
Storage Pool: fg_1, Capacity: 894 GB, State: Normal
4: Name: N/A Path: /dev/sdm Original-path: /dev/sdm ID: ddfedc3300030007
Storage Pool: fg_1, Capacity: 894 GB, State: Normal
5: Name: N/A Path: /dev/sdn Original-path: /dev/sdn ID: ddfedc3400030008
Storage Pool: fg_1, Capacity: 894 GB, State: Normal
6: Name: N/A Path: /dev/svm_sdo Original-path: /dev/svm_sdo ID: ddfedc3500030009
Storage Pool: fg_1, Capacity: 894 GB, State: Normal
7: Name: N/A Path: /dev/svm_sdp Original-path: /dev/svm_sdp ID: ddfedc360003000a
Storage Pool: fg_1, Capacity: 894 GB, State: Normal
1: Name: N/A Path: /dev/dax0.0 Original-path: /dev/dax0.0 ID:
ddfedc2100030001
Acceleration Pool: ac_1, Capacity: 15.7 GB (16052 MB), Used: 1.3 GB
(1372 MB), State: Normal
2: Name: N/A Path: /dev/dax1.0 Original-path: /dev/dax1.0 ID:
ddfedc2200030002
Acceleration Pool: ac_1, Capacity: 15.7 GB (16052 MB), Used: 1.3 GB
(1372 MB), State: Normal
3: Name: N/A Path: /dev/dax2.0 Original-path: /dev/dax2.0 ID:
ddfedc2300030003
Acceleration Pool: ac_1, Capacity: 15.7 GB (16052 MB), Used: 686.0
MB (702464 KB), State: Normal
4: Name: N/A Path: /dev/dax3.0 Original-path: /dev/dax3.0 ID:
ddfedc2400030004
Acceleration Pool: ac_1, Capacity: 15.7 GB (16052 MB), Used: 686.0
MB (702464 KB), State: Normal

Esto significa que este nodo tiene un dispositivo DAX /dev/dax1.0 utilizado por el pool de aceleración ac_1 que tiene bloques defectuosos y se debe reemplazar.

Guía de soporte de PowerFlex

  • Si este caso se encuentra solo en un host, proceda con la extracción del dispositivo DAX del sistema PowerFlex y abra una llamada de servicio a la FRU (unidad de reemplazo en campo) del dispositivo de PMEM\NVDIMM defectuoso.
  • Dell Technologies recomienda reemplazar el dispositivo de PMEM\NVDIMM tan pronto como sea posible en una ventana de mantenimiento programada.
  • El proceso de reemplazo de un NVDIMM defectuoso está documentado en la Guía de Unidades reemplazables de campo del R640\R740xd\R840, el capítulo correspondiente es: "Reemplazo de un NVDIMM en un servidor R640\R740xd\R840 de VxFlex Ready Node basado en Linux".
  • Si tiene más de un dispositivo en diferentes nodos en el mismo Pool de almacenamiento de granularidad fina con bloques dañados, abra una llamada de servicio al soporte de PowerFlex para verificar la estabilidad de los datos.

Affected Products

PowerFlex Software
Article Properties
Article Number: 000185583
Article Type: How To
Last Modified: 11 Nov 2025
Version:  8
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.