PowerFlex 4.x 如何使用 PFMP 精靈更換 NVDIMM

Summary: 本文說明如何使用 PowerFlex Manager 平台 (PFMP) 精靈,更換 PowerEdge 伺服器中的故障 NVDIMM。

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

步驟

  • 識別 iDRAC 中的故障 NVDIMM 模組,並在 PFMP 中關聯其 DAX 裝置

1- 識別 PowerEdge iDrac 的故障 NVDIMM 插槽 從「維護」標籤中,選取「系統事件記錄」。

iDRAC NVDIMM 插槽故障

在此範例中,故障的 NVDIMM 插槽為 A7 

 

2- 使用 SSH 識別故障的 NVDIMM 序號至受影響的 SDS 節點,然後執行下列命令。 

dmidecode --type memory | grep "Non-" -B 3 -A 3 | grep -E 'Locator|Serial' | grep -v Bank

將顯示類似於以下內容的輸出:

Locator: A7
Serial Number: 16492521 
Locator: B7
Serial Number: 1649251B

在此範例中,NVDIMM A7 的序號 為 16492521。

 

3- 顯示安裝在伺服器上的 NVDIMM 清單,並尋找序列16492521的 dev nmem

ndctl list -Dvvv | jq '.[].dimms'

應會出現類似以下內容的輸出:

  [
{
"dev": "nmem1",
"id": "802c-0f-1711-1649251b",
"handle": 4097,
"phys_id": 4370, "state": "disabled", "health": {
"health_state": "ok", "temperature_celsius": 255,
"life_used_percentage": 32
}
},
{
"dev": "nmem0",
"id": "802c-0f-1711-16492521",
"handle": 1,
"phys_id": 4358, "state": "disabled", "health": {
"health_state": "ok", "temperature_celsius": 255,
"life_used_percentage": 32
}
}
]

在此範例中, nmem0 是序列16492521的開發

 

4- 使用下列命令關聯 nmem 對應、 區域命名空間和DAX 組態資訊 

ndctl list -Dvvv | jq '.[].regions[]'

將顯示類似於以下內容的輸出:

 
  {
"dev": "region1", "size": 17179869184,
"available_size": 0,
"max_available_extent": 0, "type": "pmem", "numa_node": 1, "mappings": [
{
"dimm": "nmem1", "offset": 0,
"length": 17179869184,
"position": 0
}
],
"persistence_domain": "unknown", "namespaces": [
{
"dev": "namespace1.0",
"mode": "devdax",
"map": "dev", "size": 16909336576,
"uuid": "0a438fbc-91e4-427d-8068-1f26330d85cc", "daxregion": {
"id": 1,
"size": 16909336576,
"align": 4096,
"devices": [
{
"chardev": "dax1.0", "size": 16909336576
}
]
},
"numa_node": 1
}
]
}
{
"dev": "region0",
"size": 17179869184,
"available_size": 0,
"max_available_extent": 0, "type": "pmem", "numa_node": 0, "mappings": [
{
"dimm": "nmem0", "offset": 0,
"length": 17179869184,
"position": 0
}
],
"persistence_domain": "unknown", "namespaces": [
{
"dev": "namespace0.0",
"mode": "devdax",
"map": "dev", "size": 16909336576,
"uuid": "38cbd555-3f5b-4f4f-8d83-bf77db75553d", "daxregion": {
"id": 0,
"size": 16909336576,
"align": 4096,
"devices": [
{
"chardev": "dax0.0",
"size": 16909336576
}
]
},
"numa_node": 0
}
]
}

在此範例中,nmem0 位於區域區域 0、命名空間命名空間 0.0 和 DAX 設備 dax0.0 中。

這些步驟的結果是將 iDRAC 中的 A7 與 PFMP 中的 dax0.0 相互關聯。 

 

  • 卸下NVDIMM記憶體模組

使用 PowerFlex Manager NVDIMM 更換精靈,從系統卸下 NVDIMM 記憶體模組。

  1. 登入 PowerFlex Manager。
  2. 在功能表欄上,單擊“生命週期>資源”。
  3. 資源組 頁面,按兩下需要更換的資源組,查看 詳情
  4. 詳細資料頁面中,向下捲動至頁面的實體節點區段。
  5. 元件更換底下,按一下更換NVDIMM

  PowerFlex Manager 會在 NVDIMM更換精靈中顯示節點清單面板。

  1. 選取需要更換 NVDIMM 記憶體模組的節點,然後按下 一步

  PowerFlex Manager 會顯示 選取的元件 面板。所有可用的 NVDIMM 記憶體模組會顯示在 NVDIMM 接頭下,而可用的 NVDIMM 電池則會顯示在 NVDIMM 電池下。

  1. 更換 NVDIMM 下,選取您要更換的故障 NVDIMM 記憶體模組,然後按一下 下一步

   由於 NVDIMM 更換程序不可復原,因此會出現訊息,提示您確定節點選擇正確。

  1. 若要更換 NVDIMM 記憶體模組,請輸入 卸下 NVDIMM

  資源群組頁面上會顯示一則訊息,說明已移除或新增 NVDIMM 裝置,並附上節點和插槽編號。資源組和單個節點的狀態為 「進行中」。記錄詳細資料會顯示在頁面右側 的最近活動區段 中。

  隨即建立更換記憶體模組的工作。

  1. 按一下功能表列右上角 的工作 圖示,以檢視工作的詳細資料。等待工作完成。

 

  • 由 Dell 現場工程師 (FE) 對故障的 NVDIMM 進行實體更換 

將 SDS 節點放入 PMM 或 IMM,關閉節點,然後讓 Dell FE 進行故障的 NVDIMM 更換。

 

  • 完成NVDIMM記憶體模組更換

記憶體模組更換完成後,主機和 SVM 會關閉。實體更換記憶體模組後, 資源群組 頁面上的主機狀態會顯示維修模式。此外,在 「動作」下,會顯示 探索替換的 NVDIMM 選項。

先決條件

請確定您已執行 卸下 NVDIMM 記憶體模組中的步驟,然後按照這些步驟完成 NVDIMM 記憶體模組更換作業。

步驟

  1. 實體更換節點時,請按一下探索更換NVDIMM

   探索更換的 NVDIMM 會開啟節點,並對 NVDIMM 進行系統清除。

  1. 探索完成後,記錄的狀態會顯示 為已完成。在「動作」下,按一下完成NVDIMM更換選項
  1. 按一下 完成 以完成更換程序。

    更換 NVDIMM 後,您可以為 NVDIMM 裝置建立虛擬硬體,將 SDS 從維護或維修模式中移除,然後開啟 SVM。

  1. 新增 NVDIMM 記憶體模組後,資源群組頁面上會顯示 NVDIMM 裝置更換完成訊息。在 「動作」下,按一下 解除 以解除工作。

 

  • 使資源符合,並使節點恢復作業

更換硬體元件後,請更新系統資源,使資源符合相容性檔案中的韌體和驅動程式。資源合規時,將節點返回到操作。

Affected Products

PowerFlex rack, ScaleIO
Article Properties
Article Number: 000321223
Article Type: How To
Last Modified: 14 May 2025
Version:  1
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.