PowerFlex: Jak sprawdzić, czy pamięć trwała (NVDIMM) zawiera uszkodzone bloki
Summary: Pule pamięci masowej o drobnej ziarnistości PowerFlex wykorzystują pamięć trwałą (PMEM), znaną również jako nieulotny moduł DIMM (NVDIMM), w celu przyspieszenia i kompresji danych. Takie moduły DIMM mogą mieć uszkodzone bloki, podobnie jak zwykłe moduły RDIMM, i muszą być okresowo monitorowane pod kątem usterek, tak jak każdy inny typ dysku. We wcześniejszej wersji urządzenie SDS wykryje uszkodzony blok dopiero po uzyskaniu dostępu do odpowiedniej sekcji i nieudanym odczycie z powodu niepowodzenia SDS. W przypadku wcześniejszej wersji można proaktywnie wykonać następujące czynności, aby wykrywać moduły NVDIMM z uszkodzonymi blokami i wymieniać je. Uwaga: ponieważ produkt ma naturalną nadmiarowość, kopia zapasowa danych tych bloków jest tworzona w innym węźle, a w przypadku awarii SDS ulegnie awarii, a inne SDS będą obsługiwać we/wy. ...
Instructions
Ta procedura ma zastosowanie tylko do systemów operacyjnych Linux.
Uwaga: Implementacja oparta na oprogramowaniu VMware w oprogramowaniu ESXi zachowuje możliwość sprawdzania, czy urządzenie ma awarie, czy nie, i nie można wysyłać zapytań z maszyny wirtualnej pamięci masowej PowerFlex; w przypadku awarii NVDIMM magazyn danych NVRAM będzie w trybie offline, a maszyna wirtualna pamięci masowej wyłączy się i nie będzie można go uruchomić do czasu wymiany modułu NVDIMM.
Jak wykryć uszkodzone bloki w systemie operacyjnym Linux:
1. Uruchom następujące polecenie przy użyciu powłoki na każdym hoście z modułem NVDIMM:
UWAGA: Zalecana częstotliwość to raz dziennie.
ndctl list --media-errors
Przykład wyniku polecenia dla urządzenia DAX, które uległo awarii.
W poniższej części danych wyjściowych przestrzeń nazw 1.0 z językiem DAX 1.0 ma 13 uszkodzonych bloków i należy ją wymienić.
[
{
"dev":"namespace1.0",
"mode":"devdax",
"map":"dev",
"size":62914560,
"uuid":"47072fee-1447-4e04-b4ca-f28e2c03af80",
"chardev":"dax1.0",
"align":4096,
"badblock_count":13,
"badblocks":
2. Korelowanie urządzenia DAX używanego w puli pamięci masowej PowerFlex:
a. Aby pobrać listę wszystkich urządzeń pamięci masowej skonfigurowanych do każdej puli pamięci w klastrze, najpierw musimy się zalogować:
scli --login --username <NAME> --password <PASSWORD>
b. Wyświetl listę urządzeń skonfigurowanych dla każdej puli pamięci masowej:
for SNAME in $(scli --query_all_sds | grep ID: | awk '{print $5}'); do echo $SNAME ; scli --query_sds --sds_name $SNAME | grep -E "Path|Pool" ; done
Dane wyjściowe podobne do następujących powinny być wyświetlane dla każdego SDS w klastrze:
SDS_Node1 Storage Pool information (total of 2 Storage Pools): 1: Storage Pool: default inflight requests factor: 115, inflight bandwidth factor 115 2: Storage Pool: fg_1 inflight requests factor: 115, inflight bandwidth factor 115 1: Name: N/A Path: /dev/sdv Original-path: /dev/sdv ID: ddfeb59d00030000 Storage Pool: default, Capacity: 1786 GB, State: Normal 2: Name: N/A Path: /dev/sdk Original-path: /dev/sdk ID: ddfedc3100030005 Storage Pool: fg_1, Capacity: 894 GB, State: Normal 3: Name: N/A Path: /dev/sdl Original-path: /dev/sdl ID: ddfedc3200030006 Storage Pool: fg_1, Capacity: 894 GB, State: Normal 4: Name: N/A Path: /dev/sdm Original-path: /dev/sdm ID: ddfedc3300030007 Storage Pool: fg_1, Capacity: 894 GB, State: Normal 5: Name: N/A Path: /dev/sdn Original-path: /dev/sdn ID: ddfedc3400030008 Storage Pool: fg_1, Capacity: 894 GB, State: Normal 6: Name: N/A Path: /dev/svm_sdo Original-path: /dev/svm_sdo ID: ddfedc3500030009 Storage Pool: fg_1, Capacity: 894 GB, State: Normal 7: Name: N/A Path: /dev/svm_sdp Original-path: /dev/svm_sdp ID: ddfedc360003000a Storage Pool: fg_1, Capacity: 894 GB, State: Normal 1: Name: N/A Path: /dev/dax0.0 Original-path: /dev/dax0.0 ID: ddfedc2100030001 Acceleration Pool: ac_1, Capacity: 15.7 GB (16052 MB), Used: 1.3 GB (1372 MB), State: Normal 2: Name: N/A Path: /dev/dax1.0 Original-path: /dev/dax1.0 ID: ddfedc2200030002 Acceleration Pool: ac_1, Capacity: 15.7 GB (16052 MB), Used: 1.3 GB (1372 MB), State: Normal 3: Name: N/A Path: /dev/dax2.0 Original-path: /dev/dax2.0 ID: ddfedc2300030003 Acceleration Pool: ac_1, Capacity: 15.7 GB (16052 MB), Used: 686.0 MB (702464 KB), State: Normal 4: Name: N/A Path: /dev/dax3.0 Original-path: /dev/dax3.0 ID: ddfedc2400030004 Acceleration Pool: ac_1, Capacity: 15.7 GB (16052 MB), Used: 686.0 MB (702464 KB), State: Normal
Oznacza to, że ten węzeł ma urządzenie DAX /dev/dax1.0 używane przez ac_1 puli akceleracji, które ma uszkodzone bloki i musi zostać wymienione.
Wskazówki dotyczące pomocy technicznej PowerFlex
- Jeśli taki przypadek zostanie znaleziony tylko na jednym hoście, kontynuuj usuwanie urządzenia DAX z systemu PowerFlex i otwórz zgłoszenie serwisowe do FRU (Field replace unit), uszkodzonego urządzenia PMEM\NVDIMM.
- Firma Dell Technologies zaleca jak najszybszą wymianę urządzenia PMEM\NVDIMM w ramach zaplanowanej przerwy konserwacyjnej.
- Proces wymiany uszkodzonego modułu NVDIMM został udokumentowany w podręczniku jednostki R640\R740xd\R840 wymienianej w terenie, w odpowiednim rozdziale: "Wymiana modułu NVDIMM w serwerze VxFlex Ready Node R640\R740xd\R840 opartym na systemie Linux".
- Jeśli posiadasz więcej niż jedno urządzenie na różnych węzłach w tej samej puli pamięci masowej o drobnej ziarnistości z uszkodzonymi blokami, otwórz zgłoszenie serwisowe do pomocy technicznej PowerFlex, aby zweryfikować stabilność danych.