PowerFlex. Определение неисправных блоков в энергонезависимой памяти (NVDIMM)

Summary: Пулы хранения данных PowerFlex с высокой степенью детализации используют энергонезависимую память (PMEM), также известную как энергонезависимая память DIMM (NVDIMM), для ускорения и сжатия данных. Эти модули DIMM могут иметь поврежденные блоки, как и обычные модули RDIMM, и их необходимо периодически отслеживать на наличие неисправностей, как и диски любого другого типа. В более ранних версиях устройство SDS обнаруживает плохой блок только при доступе к соответствующему разделу и сбое чтения из-за сбоя SDS. В более раннем выпуске можно заблаговременно выполнять следующие действия, чтобы обнаружить модули NVDIMM с поврежденными блоками и заменить их. Примечание. Поскольку в продукте присутствует резервирование, данные этих блоков копируются на другом узле, и в случае сбоя SDS выйдет из строя, а другие SDS будут обслуживать ввод-вывод. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

Эта процедура применима только к ОС Linux.

Примечание. Реализация на базе VMware на основе ESXi сохраняет возможность проверки наличия сбоев на устройстве и не может быть запрошена из виртуальной машины хранилища PowerFlex. В случае сбоя NVDIMM хранилище данных NVRAM перейдет в автономный режим, а ВМ хранения выключится и не сможет загрузиться до замены NVDIMM.

Как обнаружить поврежденные блоки в ОС Linux:

1. Выполните следующую команду с помощью оболочки на каждом хосте с модулем NVDIMM:
 Рекомендуемая периодичность — один раз в сутки.

ndctl list --media-errors

Пример выходных данных команды для устройства DAX, в котором есть сбои.

В приведенной ниже части выходных данных пространство имен 1.0 с dax 1.0 имеет 13 поврежденных блоков и должно быть заменено.

[
  {
    "dev":"namespace1.0",
    "mode":"devdax",
    "map":"dev",
    "size":62914560,
    "uuid":"47072fee-1447-4e04-b4ca-f28e2c03af80",
    "chardev":"dax1.0",
    "align":4096,
    "badblock_count":13,
    "badblocks":

2. Сопоставление устройства DAX, которое используется в пуле хранения данных PowerFlex.

a. Чтобы получить список всех устройств хранения, настроенных для каждого пула хранения данных в кластере, сначала необходимо войти в систему:

scli --login --username <NAME> --password <PASSWORD>

Б. Просмотр списка устройств, настроенных для каждого пула хранения данных:

for SNAME in $(scli --query_all_sds | grep ID: | awk '{print $5}'); do echo $SNAME ; scli --query_sds --sds_name $SNAME | grep -E "Path|Pool" ; done

Для каждого программно-определяемого хранилища в кластере должны отображаться подобные выходные данные:

SDS_Node1
Storage Pool information (total of 2 Storage Pools):
1: Storage Pool: default inflight requests factor: 115, inflight
bandwidth factor 115
2: Storage Pool: fg_1 inflight requests factor: 115, inflight bandwidth
factor 115
1: Name: N/A Path: /dev/sdv Original-path: /dev/sdv ID: ddfeb59d00030000
Storage Pool: default, Capacity: 1786 GB, State: Normal
2: Name: N/A Path: /dev/sdk Original-path: /dev/sdk ID: ddfedc3100030005
Storage Pool: fg_1, Capacity: 894 GB, State: Normal
3: Name: N/A Path: /dev/sdl Original-path: /dev/sdl ID: ddfedc3200030006
Storage Pool: fg_1, Capacity: 894 GB, State: Normal
4: Name: N/A Path: /dev/sdm Original-path: /dev/sdm ID: ddfedc3300030007
Storage Pool: fg_1, Capacity: 894 GB, State: Normal
5: Name: N/A Path: /dev/sdn Original-path: /dev/sdn ID: ddfedc3400030008
Storage Pool: fg_1, Capacity: 894 GB, State: Normal
6: Name: N/A Path: /dev/svm_sdo Original-path: /dev/svm_sdo ID: ddfedc3500030009
Storage Pool: fg_1, Capacity: 894 GB, State: Normal
7: Name: N/A Path: /dev/svm_sdp Original-path: /dev/svm_sdp ID: ddfedc360003000a
Storage Pool: fg_1, Capacity: 894 GB, State: Normal
1: Name: N/A Path: /dev/dax0.0 Original-path: /dev/dax0.0 ID:
ddfedc2100030001
Acceleration Pool: ac_1, Capacity: 15.7 GB (16052 MB), Used: 1.3 GB
(1372 MB), State: Normal
2: Name: N/A Path: /dev/dax1.0 Original-path: /dev/dax1.0 ID:
ddfedc2200030002
Acceleration Pool: ac_1, Capacity: 15.7 GB (16052 MB), Used: 1.3 GB
(1372 MB), State: Normal
3: Name: N/A Path: /dev/dax2.0 Original-path: /dev/dax2.0 ID:
ddfedc2300030003
Acceleration Pool: ac_1, Capacity: 15.7 GB (16052 MB), Used: 686.0
MB (702464 KB), State: Normal
4: Name: N/A Path: /dev/dax3.0 Original-path: /dev/dax3.0 ID:
ddfedc2400030004
Acceleration Pool: ac_1, Capacity: 15.7 GB (16052 MB), Used: 686.0
MB (702464 KB), State: Normal

Это означает, что на этом узле есть устройство DAX /dev/dax1.0, используемое ac_1 пула ускорения, которое имеет поврежденные блоки и должно быть заменено.

Рекомендации службы поддержки PowerFlex

  • Если такая проблема обнаружена только на одном хосте, удалите устройство DAX из системы PowerFlex и откройте сервисный вызов для FRU (компонент для замены на месте) неисправного устройства PMEM\NVDIMM.
  • Dell Technologies рекомендует заменять устройство PMEM\ NVDIMM как можно скорее во время планового технического обслуживания.
  • Процедура замены неисправного модуля NVDIMM описана в руководстве по заменяемым на месте компонентам R640\R740xd\R840, соответствующая глава: «Замена NVDIMM на сервере VxFlex Ready Node R640\R740xd\R840 на базе Linux».
  • Если в одном пуле хранения данных с высокой детализацией имеется несколько устройств на разных узлах с поврежденными блоками, откройте обращение в службу технической поддержки PowerFlex для проверки стабильности данных.

Affected Products

PowerFlex Software
Article Properties
Article Number: 000185583
Article Type: How To
Last Modified: 11 Nov 2025
Version:  8
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.