PowerFlex. Определение неисправных блоков в энергонезависимой памяти (NVDIMM)
Summary: Пулы хранения данных PowerFlex с высокой степенью детализации используют энергонезависимую память (PMEM), также известную как энергонезависимая память DIMM (NVDIMM), для ускорения и сжатия данных. Эти модули DIMM могут иметь поврежденные блоки, как и обычные модули RDIMM, и их необходимо периодически отслеживать на наличие неисправностей, как и диски любого другого типа. В более ранних версиях устройство SDS обнаруживает плохой блок только при доступе к соответствующему разделу и сбое чтения из-за сбоя SDS. В более раннем выпуске можно заблаговременно выполнять следующие действия, чтобы обнаружить модули NVDIMM с поврежденными блоками и заменить их. Примечание. Поскольку в продукте присутствует резервирование, данные этих блоков копируются на другом узле, и в случае сбоя SDS выйдет из строя, а другие SDS будут обслуживать ввод-вывод. ...
Instructions
Эта процедура применима только к ОС Linux.
Примечание. Реализация на базе VMware на основе ESXi сохраняет возможность проверки наличия сбоев на устройстве и не может быть запрошена из виртуальной машины хранилища PowerFlex. В случае сбоя NVDIMM хранилище данных NVRAM перейдет в автономный режим, а ВМ хранения выключится и не сможет загрузиться до замены NVDIMM.
Как обнаружить поврежденные блоки в ОС Linux:
1. Выполните следующую команду с помощью оболочки на каждом хосте с модулем NVDIMM:
Рекомендуемая периодичность — один раз в сутки.
ndctl list --media-errors
Пример выходных данных команды для устройства DAX, в котором есть сбои.
В приведенной ниже части выходных данных пространство имен 1.0 с dax 1.0 имеет 13 поврежденных блоков и должно быть заменено.
[
{
"dev":"namespace1.0",
"mode":"devdax",
"map":"dev",
"size":62914560,
"uuid":"47072fee-1447-4e04-b4ca-f28e2c03af80",
"chardev":"dax1.0",
"align":4096,
"badblock_count":13,
"badblocks":
2. Сопоставление устройства DAX, которое используется в пуле хранения данных PowerFlex.
a. Чтобы получить список всех устройств хранения, настроенных для каждого пула хранения данных в кластере, сначала необходимо войти в систему:
scli --login --username <NAME> --password <PASSWORD>
Б. Просмотр списка устройств, настроенных для каждого пула хранения данных:
for SNAME in $(scli --query_all_sds | grep ID: | awk '{print $5}'); do echo $SNAME ; scli --query_sds --sds_name $SNAME | grep -E "Path|Pool" ; done
Для каждого программно-определяемого хранилища в кластере должны отображаться подобные выходные данные:
SDS_Node1 Storage Pool information (total of 2 Storage Pools): 1: Storage Pool: default inflight requests factor: 115, inflight bandwidth factor 115 2: Storage Pool: fg_1 inflight requests factor: 115, inflight bandwidth factor 115 1: Name: N/A Path: /dev/sdv Original-path: /dev/sdv ID: ddfeb59d00030000 Storage Pool: default, Capacity: 1786 GB, State: Normal 2: Name: N/A Path: /dev/sdk Original-path: /dev/sdk ID: ddfedc3100030005 Storage Pool: fg_1, Capacity: 894 GB, State: Normal 3: Name: N/A Path: /dev/sdl Original-path: /dev/sdl ID: ddfedc3200030006 Storage Pool: fg_1, Capacity: 894 GB, State: Normal 4: Name: N/A Path: /dev/sdm Original-path: /dev/sdm ID: ddfedc3300030007 Storage Pool: fg_1, Capacity: 894 GB, State: Normal 5: Name: N/A Path: /dev/sdn Original-path: /dev/sdn ID: ddfedc3400030008 Storage Pool: fg_1, Capacity: 894 GB, State: Normal 6: Name: N/A Path: /dev/svm_sdo Original-path: /dev/svm_sdo ID: ddfedc3500030009 Storage Pool: fg_1, Capacity: 894 GB, State: Normal 7: Name: N/A Path: /dev/svm_sdp Original-path: /dev/svm_sdp ID: ddfedc360003000a Storage Pool: fg_1, Capacity: 894 GB, State: Normal 1: Name: N/A Path: /dev/dax0.0 Original-path: /dev/dax0.0 ID: ddfedc2100030001 Acceleration Pool: ac_1, Capacity: 15.7 GB (16052 MB), Used: 1.3 GB (1372 MB), State: Normal 2: Name: N/A Path: /dev/dax1.0 Original-path: /dev/dax1.0 ID: ddfedc2200030002 Acceleration Pool: ac_1, Capacity: 15.7 GB (16052 MB), Used: 1.3 GB (1372 MB), State: Normal 3: Name: N/A Path: /dev/dax2.0 Original-path: /dev/dax2.0 ID: ddfedc2300030003 Acceleration Pool: ac_1, Capacity: 15.7 GB (16052 MB), Used: 686.0 MB (702464 KB), State: Normal 4: Name: N/A Path: /dev/dax3.0 Original-path: /dev/dax3.0 ID: ddfedc2400030004 Acceleration Pool: ac_1, Capacity: 15.7 GB (16052 MB), Used: 686.0 MB (702464 KB), State: Normal
Это означает, что на этом узле есть устройство DAX /dev/dax1.0, используемое ac_1 пула ускорения, которое имеет поврежденные блоки и должно быть заменено.
Рекомендации службы поддержки PowerFlex
- Если такая проблема обнаружена только на одном хосте, удалите устройство DAX из системы PowerFlex и откройте сервисный вызов для FRU (компонент для замены на месте) неисправного устройства PMEM\NVDIMM.
- Dell Technologies рекомендует заменять устройство PMEM\ NVDIMM как можно скорее во время планового технического обслуживания.
- Процедура замены неисправного модуля NVDIMM описана в руководстве по заменяемым на месте компонентам R640\R740xd\R840, соответствующая глава: «Замена NVDIMM на сервере VxFlex Ready Node R640\R740xd\R840 на базе Linux».
- Если в одном пуле хранения данных с высокой детализацией имеется несколько устройств на разных узлах с поврежденными блоками, откройте обращение в службу технической поддержки PowerFlex для проверки стабильности данных.