PowerFlex: Jak zjistit, zda trvalá paměť (NVDIMM) obsahuje chybné bloky
Summary: Fondy úložišť PowerFlex s jemnou členitostí používají k akceleraci a kompresi dat trvalou paměť (PMEM), známou také jako nevolatilní modul DIMM (NVDIMM). Tyto moduly DIMM mohou mít vadné bloky stejně jako běžné moduly RDIMM a je nutné je pravidelně sledovat, zda nedochází k jejich selhání, stejně jako u jakéhokoli jiného typu disku. Ve starší verzi zařízení SDS zjistí chybný blok pouze při přístupu k příslušné části a selže čtení selháním SDS. V dřívější verzi lze pomocí následujících kroků proaktivně rozpoznat moduly NVDIMM s vadnými bloky a nahradit je. Poznámka: protože máme v produktu inherentní redundanci, data těchto bloků jsou zálohována na jiném uzlu a v případě selhání SDS selže a ostatní SDS budou obsluhovat IO. ...
Instructions
Tento postup platí pouze pro operační systémy Linux.
Poznámka: Implementace založená na systému VMware v systému ESXi zachovává schopnost kontrolovat, zda má zařízení vadné či nikoli, a nelze se na ni dotazovat z virtuálního počítače úložiště PowerFlex. V případě selhání modulu NVDIMM bude datové úložiště NVRAM offline a virtuální počítač úložiště se vypne a nebude možné jej spustit, dokud nevyměníte modul NVDIMM.
Jak zjistit vadné bloky v operačním systému Linux:
1. Spusťte následující příkaz pomocí prostředí na každém hostiteli s modulem NVDIMM:
POZNÁMKA: Doporučená frekvence je jednou denně.
ndctl list --media-errors
Příklad výstupu příkazu pro zařízení DAX, které má chyby.
V následující části výstupu má obor názvů 1.0 s jazykem DAX 1.0 13 chybných bloků a musí být nahrazen.
[
{
"dev":"namespace1.0",
"mode":"devdax",
"map":"dev",
"size":62914560,
"uuid":"47072fee-1447-4e04-b4ca-f28e2c03af80",
"chardev":"dax1.0",
"align":4096,
"badblock_count":13,
"badblocks":
2. Korelace zařízení DAX, které se používá ve fondu úložiště PowerFlex:
a. Chcete-li načíst seznam všech úložných zařízení nakonfigurovaných pro každý fond úložiště v clusteru, je nutné se nejprve přihlásit:
scli --login --username <NAME> --password <PASSWORD>
b. Zobrazení seznamu zařízení nakonfigurovaných pro každý fond úložiště:
for SNAME in $(scli --query_all_sds | grep ID: | awk '{print $5}'); do echo $SNAME ; scli --query_sds --sds_name $SNAME | grep -E "Path|Pool" ; done
Pro každé SDS v clusteru by se měl zobrazit výstup podobný následujícímu:
SDS_Node1 Storage Pool information (total of 2 Storage Pools): 1: Storage Pool: default inflight requests factor: 115, inflight bandwidth factor 115 2: Storage Pool: fg_1 inflight requests factor: 115, inflight bandwidth factor 115 1: Name: N/A Path: /dev/sdv Original-path: /dev/sdv ID: ddfeb59d00030000 Storage Pool: default, Capacity: 1786 GB, State: Normal 2: Name: N/A Path: /dev/sdk Original-path: /dev/sdk ID: ddfedc3100030005 Storage Pool: fg_1, Capacity: 894 GB, State: Normal 3: Name: N/A Path: /dev/sdl Original-path: /dev/sdl ID: ddfedc3200030006 Storage Pool: fg_1, Capacity: 894 GB, State: Normal 4: Name: N/A Path: /dev/sdm Original-path: /dev/sdm ID: ddfedc3300030007 Storage Pool: fg_1, Capacity: 894 GB, State: Normal 5: Name: N/A Path: /dev/sdn Original-path: /dev/sdn ID: ddfedc3400030008 Storage Pool: fg_1, Capacity: 894 GB, State: Normal 6: Name: N/A Path: /dev/svm_sdo Original-path: /dev/svm_sdo ID: ddfedc3500030009 Storage Pool: fg_1, Capacity: 894 GB, State: Normal 7: Name: N/A Path: /dev/svm_sdp Original-path: /dev/svm_sdp ID: ddfedc360003000a Storage Pool: fg_1, Capacity: 894 GB, State: Normal 1: Name: N/A Path: /dev/dax0.0 Original-path: /dev/dax0.0 ID: ddfedc2100030001 Acceleration Pool: ac_1, Capacity: 15.7 GB (16052 MB), Used: 1.3 GB (1372 MB), State: Normal 2: Name: N/A Path: /dev/dax1.0 Original-path: /dev/dax1.0 ID: ddfedc2200030002 Acceleration Pool: ac_1, Capacity: 15.7 GB (16052 MB), Used: 1.3 GB (1372 MB), State: Normal 3: Name: N/A Path: /dev/dax2.0 Original-path: /dev/dax2.0 ID: ddfedc2300030003 Acceleration Pool: ac_1, Capacity: 15.7 GB (16052 MB), Used: 686.0 MB (702464 KB), State: Normal 4: Name: N/A Path: /dev/dax3.0 Original-path: /dev/dax3.0 ID: ddfedc2400030004 Acceleration Pool: ac_1, Capacity: 15.7 GB (16052 MB), Used: 686.0 MB (702464 KB), State: Normal
To znamená, že tento uzel má zařízení DAX /dev/dax1.0 používané ac_1 akceleračního fondu, které obsahuje vadné bloky a je nutné jej vyměnit.
Pokyny pro podporu PowerFlex
- Pokud se takový případ vyskytne pouze na jednom hostiteli, pokračujte odebráním zařízení DAX ze systému PowerFlex a zahájte servisní zásah FRU (jednotka pro výměnu v terénu) vadného zařízení PMEM\NVDIMM.
- Společnost Dell Technologies doporučuje vyměnit zařízení PMEM\ NVDIMM co nejdříve v rámci plánovaného intervalu údržby.
- Postup výměny vadného modulu NVDIMM je popsán v příručce k jednotkám vyměnitelným v terénu R640/R740xd/R840, příslušná kapitola je: "Výměna modulu NVDIMM v serveru VxFlex Ready Node R640\R740xd\R840 založeném na systému Linux."
- Pokud máte v různých uzlech ve stejném fondu úložiště Fine Granularity více než jedno zařízení se špatnými bloky, otevřete požadavek na opravu u podpory PowerFlex a ověřte stabilitu dat.