PowerFlex: Sådan registrerer du, om Persistent Memory (NVDIMM) har dårlige blokeringer
Summary: PowerFlex Fine Granularity Storage Pools bruger PMEM (Persistent Memory), også kendt som NVDIMM (Non-Volatile DIMM), til at accelerere og komprimere data. Disse DIMM-moduler kan have beskadigede blokke ligesom almindelige RDIMM er og skal overvåges jævnligt for fejl som alle andre disktyper. I en tidligere udgivelse registrerer SDS-enheden kun den dårlige blok, når den får adgang til det relevante afsnit og mislykkes læsningen ved at mislykkes i SDS. I den tidligere version kan følgende trin følges proaktivt for at registrere NVDIMM'er med beskadigede blokke og erstatte dem. Bemærk: da vi har iboende redundans i produktet, sikkerhedskopieres dataene fra disse blokke på en anden node, og i tilfælde af fejl vil SDS mislykkes, og de andre SDS'er vil servicere IO. ...
Instructions
Denne procedure er kun relevant for Linux-baserede operativsystemer.
Bemærk: VMware-baseret implementering på ESXi bevarer muligheden for at kontrollere, om enheden har fejl eller ej og kan ikke forespørges fra PowerFlex Storage VM. I tilfælde af NVDIMM-fejl vil NVRAM-datalageret være offline, og Storage VM vil slukke og ikke kunne starte, før NVDIMM er udskiftet.
Sådan registreres de dårlige blokke på Linux OS:
1. Kør følgende kommando ved hjælp af shellen på hver vært, der har en NVDIMM:
BEMÆRK: Frekvensanbefalingen er en gang dagligt.
ndctl list --media-errors
Eksempel på kommandooutput for en DAX-enhed, der har fejl.
I nedenstående del af outputtet har navneområde 1.0 med dax 1.0 13 beskadigede blokke og skal udskiftes.
[
{
"dev":"namespace1.0",
"mode":"devdax",
"map":"dev",
"size":62914560,
"uuid":"47072fee-1447-4e04-b4ca-f28e2c03af80",
"chardev":"dax1.0",
"align":4096,
"badblock_count":13,
"badblocks":
2. Korrelerer den DAX-enhed, der er i brug i en PowerFlex-lagerpulje:
en. For at hente en liste over alle storageenheder, der er konfigureret til hver lagerpulje i klyngen, skal vi først logge på:
scli --login --username <NAME> --password <PASSWORD>
b. Få vist en liste over enheder, der er konfigureret til hver lagerpulje:
for SNAME in $(scli --query_all_sds | grep ID: | awk '{print $5}'); do echo $SNAME ; scli --query_sds --sds_name $SNAME | grep -E "Path|Pool" ; done
En udlæsning i stil med følgende bør vises for hver SDS i klyngen:
SDS_Node1 Storage Pool information (total of 2 Storage Pools): 1: Storage Pool: default inflight requests factor: 115, inflight bandwidth factor 115 2: Storage Pool: fg_1 inflight requests factor: 115, inflight bandwidth factor 115 1: Name: N/A Path: /dev/sdv Original-path: /dev/sdv ID: ddfeb59d00030000 Storage Pool: default, Capacity: 1786 GB, State: Normal 2: Name: N/A Path: /dev/sdk Original-path: /dev/sdk ID: ddfedc3100030005 Storage Pool: fg_1, Capacity: 894 GB, State: Normal 3: Name: N/A Path: /dev/sdl Original-path: /dev/sdl ID: ddfedc3200030006 Storage Pool: fg_1, Capacity: 894 GB, State: Normal 4: Name: N/A Path: /dev/sdm Original-path: /dev/sdm ID: ddfedc3300030007 Storage Pool: fg_1, Capacity: 894 GB, State: Normal 5: Name: N/A Path: /dev/sdn Original-path: /dev/sdn ID: ddfedc3400030008 Storage Pool: fg_1, Capacity: 894 GB, State: Normal 6: Name: N/A Path: /dev/svm_sdo Original-path: /dev/svm_sdo ID: ddfedc3500030009 Storage Pool: fg_1, Capacity: 894 GB, State: Normal 7: Name: N/A Path: /dev/svm_sdp Original-path: /dev/svm_sdp ID: ddfedc360003000a Storage Pool: fg_1, Capacity: 894 GB, State: Normal 1: Name: N/A Path: /dev/dax0.0 Original-path: /dev/dax0.0 ID: ddfedc2100030001 Acceleration Pool: ac_1, Capacity: 15.7 GB (16052 MB), Used: 1.3 GB (1372 MB), State: Normal 2: Name: N/A Path: /dev/dax1.0 Original-path: /dev/dax1.0 ID: ddfedc2200030002 Acceleration Pool: ac_1, Capacity: 15.7 GB (16052 MB), Used: 1.3 GB (1372 MB), State: Normal 3: Name: N/A Path: /dev/dax2.0 Original-path: /dev/dax2.0 ID: ddfedc2300030003 Acceleration Pool: ac_1, Capacity: 15.7 GB (16052 MB), Used: 686.0 MB (702464 KB), State: Normal 4: Name: N/A Path: /dev/dax3.0 Original-path: /dev/dax3.0 ID: ddfedc2400030004 Acceleration Pool: ac_1, Capacity: 15.7 GB (16052 MB), Used: 686.0 MB (702464 KB), State: Normal
Det betyder, at denne node har en DAX-enhed/dev/dax1.0, der bruges af accelerationspulje-ac_1, som har dårlige blokke og skal udskiftes.
Vejledning til PowerFlex-support
- Hvis et sådant tilfælde kun findes på én vært, skal du fortsætte med at fjerne DAX-enheden fra PowerFlex-systemet og åbne et servicekald til den defekte PMEM\NVDIMM-enhed, FRU (feltudskiftningsenhed).
- Dell Technologies anbefaler, at du udskifter PMEM\NVDIMM-enheden så hurtigt som muligt i et planlagt vedligeholdelsesvindue.
- Processen med at udskifte et defekt NVDIMM er dokumenteret i R640\R740xd\R840 Field Replaceable Unit Guide, og det relevante kapitel er: "Udskiftning af en NVDIMM i en Linux-baseret R640\R740xd\R840-server med VxFlex Ready-node."
- Hvis du har mere end én enhed på forskellige noder i samme Fine Granularity-lagerpulje med beskadigede sektorer, skal du åbne et serviceopkald til PowerFlex-understøttelse for at få bekræftet datastabiliteten.