PowerFlex:如何偵測持久型記憶體 (NVDIMM) 是否具有損毀磁區

Summary: PowerFlex 的精細儲存集區使用持久型記憶體 (PMEM),又稱為 Non-Volatile DIMM (NVDIMM),以加速和壓縮資料。 這些 DIMM 可能具有損毀磁區,就像一般 RDIMM 一樣,與任何其他類型的磁碟機一樣,必須定期監控是否發生錯誤。 在較早的版本中,SDS 裝置只有在存取相關區段時才會偵測到損毀磁區,並因 SDS 失敗而導致讀取失敗。 對於早期版本,可以主動執行以下步驟,以檢測具有損毀磁區的 NVDIMM,並加以更換。 注意:由於我們在產品中具有固有的冗餘,因此這些塊的數據會備份到另一個節點上,如果發生故障,SDS 將失敗,而其他 SDS 將為 IO 提供服務。 ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

此程序僅適用於以 Linux 為基礎的 OS。

注意:以 VMware 為基礎的 ESXi 實作可保有此功能,以檢查裝置是否發生故障且無法從 PowerFlex 儲存虛擬機器查詢,萬一 NVDIMM 故障,NVRAM 資料存放區將會離線,而儲存虛擬機器將關閉電源,且在更換 NVDIMM 之前無法開機。

如何偵測 Linux 作業系統上的損毀磁區:

1.在每個具有 NVDIMM 的主機上,使用 Shell 執行下列命令:
注意:頻率建議為每天一次。

ndctl list --media-errors

出現故障的 DAX 裝置命令輸出範例。

在以下的輸出部分中,包含 dax 1.0 的命名空間 1.0 有 13 個損毀的磁區,必須更換。

[
  {
    "dev":"namespace1.0",
    "mode":"devdax",
    "map":"dev",
    "size":62914560,
    "uuid":"47072fee-1447-4e04-b4ca-f28e2c03af80",
    "chardev":"dax1.0",
    "align":4096,
    "badblock_count":13,
    "badblocks":

2.將在 PowerFlex 儲存集區中使用的 DAX 裝置相互關聯:

一個。為了擷取設定至叢集中每個儲存集區的所有儲存裝置的清單,首先,我們必須登入:

scli --login --username <NAME> --password <PASSWORD>

b. 檢視設定至每個儲存集區的裝置清單:

for SNAME in $(scli --query_all_sds | grep ID: | awk '{print $5}'); do echo $SNAME ; scli --query_sds --sds_name $SNAME | grep -E "Path|Pool" ; done

叢集中的每一個軟體定義儲存 (SDS) 應會出現類似以下的輸出結果:

SDS_Node1
Storage Pool information (total of 2 Storage Pools):
1: Storage Pool: default inflight requests factor: 115, inflight
bandwidth factor 115
2: Storage Pool: fg_1 inflight requests factor: 115, inflight bandwidth
factor 115
1: Name: N/A Path: /dev/sdv Original-path: /dev/sdv ID: ddfeb59d00030000
Storage Pool: default, Capacity: 1786 GB, State: Normal
2: Name: N/A Path: /dev/sdk Original-path: /dev/sdk ID: ddfedc3100030005
Storage Pool: fg_1, Capacity: 894 GB, State: Normal
3: Name: N/A Path: /dev/sdl Original-path: /dev/sdl ID: ddfedc3200030006
Storage Pool: fg_1, Capacity: 894 GB, State: Normal
4: Name: N/A Path: /dev/sdm Original-path: /dev/sdm ID: ddfedc3300030007
Storage Pool: fg_1, Capacity: 894 GB, State: Normal
5: Name: N/A Path: /dev/sdn Original-path: /dev/sdn ID: ddfedc3400030008
Storage Pool: fg_1, Capacity: 894 GB, State: Normal
6: Name: N/A Path: /dev/svm_sdo Original-path: /dev/svm_sdo ID: ddfedc3500030009
Storage Pool: fg_1, Capacity: 894 GB, State: Normal
7: Name: N/A Path: /dev/svm_sdp Original-path: /dev/svm_sdp ID: ddfedc360003000a
Storage Pool: fg_1, Capacity: 894 GB, State: Normal
1: Name: N/A Path: /dev/dax0.0 Original-path: /dev/dax0.0 ID:
ddfedc2100030001
Acceleration Pool: ac_1, Capacity: 15.7 GB (16052 MB), Used: 1.3 GB
(1372 MB), State: Normal
2: Name: N/A Path: /dev/dax1.0 Original-path: /dev/dax1.0 ID:
ddfedc2200030002
Acceleration Pool: ac_1, Capacity: 15.7 GB (16052 MB), Used: 1.3 GB
(1372 MB), State: Normal
3: Name: N/A Path: /dev/dax2.0 Original-path: /dev/dax2.0 ID:
ddfedc2300030003
Acceleration Pool: ac_1, Capacity: 15.7 GB (16052 MB), Used: 686.0
MB (702464 KB), State: Normal
4: Name: N/A Path: /dev/dax3.0 Original-path: /dev/dax3.0 ID:
ddfedc2400030004
Acceleration Pool: ac_1, Capacity: 15.7 GB (16052 MB), Used: 686.0
MB (702464 KB), State: Normal

這表示此節點具有一個由 Acceleration Pool ac_1 使用的 DAX 裝置 /dev/dax1.0,該裝置具有不良磁區且必須更換。

PowerFlex 支援指示

  • 如果僅在一個主機上發現此類案例,請繼續從 PowerFlex 系統移除 DAX 裝置,並為故障的 PMEM\NVDIMM 裝置開立 FRU (可現場更換的零件) 維修出勤。
  • Dell Technologies 建議您在排定的維護時段,儘快更換 PMEM\NVDIMM 裝置。
  • 更換故障 NVDIMM 的程序記錄在 R640\R740xd\R840 現場可更換單元指南中,相關章節為:「在 Linux 型 VxFlex Ready Node R640\R740xd\R840 伺服器上更換 NVDIMM。」
  • 如果您在的相同精細儲存集區中的不同節點上有一個以上的裝置具有損毀磁區,請向 PowerFlex 支援開立維修出勤,以確認資料穩定性。

Affected Products

PowerFlex Software
Article Properties
Article Number: 000185583
Article Type: How To
Last Modified: 11 Nov 2025
Version:  8
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.