PowerFlex: Hvordan oppdage om fast minne (NVDIMM) har dårlige blokker
Summary: PowerFlex-lagringsutvalg med fint granularitet bruker fast minne (PMEM), også kjent som ikke-flyktig DIMM (NVDIMM), til å akselerere og komprimere data. Disse DIMM-ene kan ha ugyldige blokker akkurat som vanlige RDIMM-er, og de må overvåkes med jevne mellomrom for feil som alle andre typer disker. I en tidligere utgivelse vil SDS-enheten bare oppdage den dårlige blokken når du åpner den aktuelle delen og mislykkes i lesingen ved å mislykkes SDS. For den tidligere versjonen kan følgende trinn følges proaktivt for å oppdage NVDIMM-er med skadede blokker og erstatte dem. Merk: Siden vi har iboende redundans i produktet, blir dataene til disse blokkene sikkerhetskopiert på en annen node, og i tilfelle feil vil SDS mislykkes, og de andre SDS-ene vil betjene IO-en. ...
Instructions
Denne fremgangsmåten gjelder bare for Linux-baserte operativsystemer.
Merk: VMware-basert implementering på ESXi beholder muligheten til å kontrollere om enheten har feil eller ikke, og kan ikke spørres fra PowerFlex Storage VM. I tilfelle NVDIMM-feil vil NVRAM-datalageret være frakoblet og lagrings-VM-en slås av og kan ikke starte opp før NVDIMM-en er erstattet.
Slik oppdager du de dårlige blokkene på Linux OS:
1. Kjør følgende kommando ved hjelp av skallet på hver vert som har en NVDIMM:
MERK: Frekvensanbefalingen er en gang om dagen.
ndctl list --media-errors
Eksempel på kommandoutdata for en DAX-enhet som har feil.
I den nedenstående delen av utdataene har navneområde 1.0 med dax 1.0 13 dårlige blokker og må byttes ut.
[
{
"dev":"namespace1.0",
"mode":"devdax",
"map":"dev",
"size":62914560,
"uuid":"47072fee-1447-4e04-b4ca-f28e2c03af80",
"chardev":"dax1.0",
"align":4096,
"badblock_count":13,
"badblocks":
2. Koordinere DAX-enheten som bruke i et PowerFlex-lagringsutvalg:
en. Hvis vi vil hente en liste over alle lagringsenhetene som er konfigurert til hvert lagringsutvalg i klyngen, må vi først logge på:
scli --login --username <NAME> --password <PASSWORD>
b. Vis listen over enheter som er konfigurert til hver lagringsgruppe:
for SNAME in $(scli --query_all_sds | grep ID: | awk '{print $5}'); do echo $SNAME ; scli --query_sds --sds_name $SNAME | grep -E "Path|Pool" ; done
Utdata som ligner på følgende, skal vises for hver SDS i klyngen:
SDS_Node1 Storage Pool information (total of 2 Storage Pools): 1: Storage Pool: default inflight requests factor: 115, inflight bandwidth factor 115 2: Storage Pool: fg_1 inflight requests factor: 115, inflight bandwidth factor 115 1: Name: N/A Path: /dev/sdv Original-path: /dev/sdv ID: ddfeb59d00030000 Storage Pool: default, Capacity: 1786 GB, State: Normal 2: Name: N/A Path: /dev/sdk Original-path: /dev/sdk ID: ddfedc3100030005 Storage Pool: fg_1, Capacity: 894 GB, State: Normal 3: Name: N/A Path: /dev/sdl Original-path: /dev/sdl ID: ddfedc3200030006 Storage Pool: fg_1, Capacity: 894 GB, State: Normal 4: Name: N/A Path: /dev/sdm Original-path: /dev/sdm ID: ddfedc3300030007 Storage Pool: fg_1, Capacity: 894 GB, State: Normal 5: Name: N/A Path: /dev/sdn Original-path: /dev/sdn ID: ddfedc3400030008 Storage Pool: fg_1, Capacity: 894 GB, State: Normal 6: Name: N/A Path: /dev/svm_sdo Original-path: /dev/svm_sdo ID: ddfedc3500030009 Storage Pool: fg_1, Capacity: 894 GB, State: Normal 7: Name: N/A Path: /dev/svm_sdp Original-path: /dev/svm_sdp ID: ddfedc360003000a Storage Pool: fg_1, Capacity: 894 GB, State: Normal 1: Name: N/A Path: /dev/dax0.0 Original-path: /dev/dax0.0 ID: ddfedc2100030001 Acceleration Pool: ac_1, Capacity: 15.7 GB (16052 MB), Used: 1.3 GB (1372 MB), State: Normal 2: Name: N/A Path: /dev/dax1.0 Original-path: /dev/dax1.0 ID: ddfedc2200030002 Acceleration Pool: ac_1, Capacity: 15.7 GB (16052 MB), Used: 1.3 GB (1372 MB), State: Normal 3: Name: N/A Path: /dev/dax2.0 Original-path: /dev/dax2.0 ID: ddfedc2300030003 Acceleration Pool: ac_1, Capacity: 15.7 GB (16052 MB), Used: 686.0 MB (702464 KB), State: Normal 4: Name: N/A Path: /dev/dax3.0 Original-path: /dev/dax3.0 ID: ddfedc2400030004 Acceleration Pool: ac_1, Capacity: 15.7 GB (16052 MB), Used: 686.0 MB (702464 KB), State: Normal
Dette betyr at denne noden har en DAX-enhet /dev/dax1.0 som brukes av acceleration pool ac_1 som har ugyldige blokker og må byttes ut.
Støtteveiledning for PowerFlex
- Hvis et slikt tilfelle bare blir funnet på én vert, fortsetter du med å fjerne DAX-enheten fra PowerFlex-systemet og åpne et serviceanrop til FRU (enhet for feltutskifting), den defekte PMEM\NVDIMM-enheten.
- Dell Technologies anbefaler at du skifter ut PMEM\NVDIMM-enheten så snart som mulig i et planlagt vedlikeholdsvindu.
- Fremgangsmåten for å skifte ut en defekt NVDIMM er dokumentert i veiledningen for utskifting av felterstatningsenhet for R640/R740xd/R840. Det relevante kapitlet er: "Bytte ut en NVDIMM i en Linux-basert VxFlex Ready Node R640\R740xd\R840-server."
- Hvis du har mer enn én enhet på ulike noder i samme Fine Granularity-lagringsgruppe med ugyldige blokker, kan du opprette en servicehenvendelse til PowerFlex-støtten for å kontrollere datastabiliteten.