PowerFlex: Så här identifierar du om beständigt minne (NVDIMM) har felaktiga block
Summary: PowerFlex lagringspooler med fin granularitet använder beständigt minne (PMEM), även kallat NVDIMM-minne (Non-Volatile DIMM), för att snabba upp och komprimera data. Dessa DIMM-moduler kan ha felaktiga block precis som vanliga RDIMM-moduler och måste övervakas regelbundet för fel som alla andra typer av diskar. I en tidigare version kommer SDS-enheten endast att upptäcka det felaktiga blocket vid åtkomst till det relevanta avsnittet och misslyckas med läsningen genom att misslyckas med SDS. För den tidigare versionen kan följande steg följas proaktivt för att identifiera NVDIMM-moduler med felaktiga block och byta ut dem. Obs: eftersom vi har inbyggd redundans i produkten säkerhetskopieras data för dessa block till en annan nod och i händelse av fel kommer SDS:erna att misslyckas och de andra SDS:erna kommer att betjäna IO:n. ...
Instructions
Den här proceduren gäller endast för Linux-baserade operativsystem.
Obs! VMware-baserad implementering på ESXi upprätthåller funktionen att kontrollera om enheten har fel eller inte och inte kan efterfrågas från PowerFlex lagrings-VM. I händelse av NVDIMM-fel kommer NVRAM-datalagret att vara offline och den virtuella lagringsdatorn stängs av och kan inte starta förrän NVDIMM har bytts ut.
Så här upptäcker du de dåliga blocken på Linux OS:
1. Kör följande kommando med hjälp av skalet på varje värd som har en NVDIMM:
Obs! Rekommendationen om frekvens är en gång om dagen.
ndctl list --media-errors
Exempel på kommandoutdata för en DAX-enhet som har fel.
I nedanstående del av utdata har namnområde 1.0 med dax 1.0 13 felaktiga block och måste ersättas.
[
{
"dev":"namespace1.0",
"mode":"devdax",
"map":"dev",
"size":62914560,
"uuid":"47072fee-1447-4e04-b4ca-f28e2c03af80",
"chardev":"dax1.0",
"align":4096,
"badblock_count":13,
"badblocks":
2. Korrelera DAX-enheten som används i en PowerFlex-lagringspool:
a. För att kunna hämta en lista över alla lagringsenheter som har konfigurerats för varje lagringspool i klustret måste vi först logga in:
scli --login --username <NAME> --password <PASSWORD>
b. Se listan över enheter som konfigurerats för varje lagringspool:
for SNAME in $(scli --query_all_sds | grep ID: | awk '{print $5}'); do echo $SNAME ; scli --query_sds --sds_name $SNAME | grep -E "Path|Pool" ; done
Utdata som liknar följande bör visas för varje SDS i klustret:
SDS_Node1 Storage Pool information (total of 2 Storage Pools): 1: Storage Pool: default inflight requests factor: 115, inflight bandwidth factor 115 2: Storage Pool: fg_1 inflight requests factor: 115, inflight bandwidth factor 115 1: Name: N/A Path: /dev/sdv Original-path: /dev/sdv ID: ddfeb59d00030000 Storage Pool: default, Capacity: 1786 GB, State: Normal 2: Name: N/A Path: /dev/sdk Original-path: /dev/sdk ID: ddfedc3100030005 Storage Pool: fg_1, Capacity: 894 GB, State: Normal 3: Name: N/A Path: /dev/sdl Original-path: /dev/sdl ID: ddfedc3200030006 Storage Pool: fg_1, Capacity: 894 GB, State: Normal 4: Name: N/A Path: /dev/sdm Original-path: /dev/sdm ID: ddfedc3300030007 Storage Pool: fg_1, Capacity: 894 GB, State: Normal 5: Name: N/A Path: /dev/sdn Original-path: /dev/sdn ID: ddfedc3400030008 Storage Pool: fg_1, Capacity: 894 GB, State: Normal 6: Name: N/A Path: /dev/svm_sdo Original-path: /dev/svm_sdo ID: ddfedc3500030009 Storage Pool: fg_1, Capacity: 894 GB, State: Normal 7: Name: N/A Path: /dev/svm_sdp Original-path: /dev/svm_sdp ID: ddfedc360003000a Storage Pool: fg_1, Capacity: 894 GB, State: Normal 1: Name: N/A Path: /dev/dax0.0 Original-path: /dev/dax0.0 ID: ddfedc2100030001 Acceleration Pool: ac_1, Capacity: 15.7 GB (16052 MB), Used: 1.3 GB (1372 MB), State: Normal 2: Name: N/A Path: /dev/dax1.0 Original-path: /dev/dax1.0 ID: ddfedc2200030002 Acceleration Pool: ac_1, Capacity: 15.7 GB (16052 MB), Used: 1.3 GB (1372 MB), State: Normal 3: Name: N/A Path: /dev/dax2.0 Original-path: /dev/dax2.0 ID: ddfedc2300030003 Acceleration Pool: ac_1, Capacity: 15.7 GB (16052 MB), Used: 686.0 MB (702464 KB), State: Normal 4: Name: N/A Path: /dev/dax3.0 Original-path: /dev/dax3.0 ID: ddfedc2400030004 Acceleration Pool: ac_1, Capacity: 15.7 GB (16052 MB), Used: 686.0 MB (702464 KB), State: Normal
Det innebär att den här noden har en DAX-enhet /dev/dax1.0 som används av accelerationspoolen ac_1 som har felaktiga block och måste ersättas.
Supportvägledning för PowerFlex
- Om ett sådant fall endast hittas på en värd fortsätter du med att ta bort DAX-enheten från PowerFlex-systemet och öppnar ett serviceanrop till FRU (fältersättningsenhet) den felaktiga PMEM\NVDIMM-enheten.
- Dell Technologies rekommenderar att du byter ut PMEM\ NVDIMM-enheten så snart som möjligt under en planerad underhållsperiod.
- Processen för att byta ut en felaktig NVDIMM finns dokumenterad i R640/R740xd/R840 Field Replaceable Unit Guide. Relevant kapitel är: "Byta ut en NVDIMM i en Linux-baserad VxFlex Ready-nod R640\R740xd\R840-server."
- Om du har mer än en enhet med felaktiga block på olika noder i samma lagringspool med hög granularitet öppnar du ett serviceärende med PowerFlex-supporten för att verifiera datastabiliteten.