PowerFlex 4.x 如何使用 PFMP 精靈更換 NVDIMM
Summary: 本文說明如何使用 PowerFlex Manager 平台 (PFMP) 精靈,更換 PowerEdge 伺服器中的故障 NVDIMM。
Instructions
步驟
- 識別 iDRAC 中的故障 NVDIMM 模組,並在 PFMP 中關聯其 DAX 裝置
1- 識別 PowerEdge iDrac 的故障 NVDIMM 插槽 從「維護」標籤中,選取「系統事件記錄」。

在此範例中,故障的 NVDIMM 插槽為 A7
2- 使用 SSH 識別故障的 NVDIMM 序號至受影響的 SDS 節點,然後執行下列命令。
dmidecode --type memory | grep "Non-" -B 3 -A 3 | grep -E 'Locator|Serial' | grep -v Bank
將顯示類似於以下內容的輸出:
Locator: A7 Serial Number: 16492521 Locator: B7 Serial Number: 1649251B
在此範例中,NVDIMM A7 的序號 為 16492521。
3- 顯示安裝在伺服器上的 NVDIMM 清單,並尋找序列16492521的 dev nmem。
ndctl list -Dvvv | jq '.[].dimms'
應會出現類似以下內容的輸出:
[
{
"dev": "nmem1",
"id": "802c-0f-1711-1649251b",
"handle": 4097,
"phys_id": 4370, "state": "disabled", "health": {
"health_state": "ok", "temperature_celsius": 255,
"life_used_percentage": 32
}
},
{
"dev": "nmem0",
"id": "802c-0f-1711-16492521",
"handle": 1,
"phys_id": 4358, "state": "disabled", "health": {
"health_state": "ok", "temperature_celsius": 255,
"life_used_percentage": 32
}
}
]
在此範例中, nmem0 是序列16492521的開發 。
4- 使用下列命令關聯 nmem 對應、 區域、命名空間和DAX 組態資訊
ndctl list -Dvvv | jq '.[].regions[]'
將顯示類似於以下內容的輸出:
{
"dev": "region1", "size": 17179869184,
"available_size": 0,
"max_available_extent": 0, "type": "pmem", "numa_node": 1, "mappings": [
{
"dimm": "nmem1", "offset": 0,
"length": 17179869184,
"position": 0
}
],
"persistence_domain": "unknown", "namespaces": [
{
"dev": "namespace1.0",
"mode": "devdax",
"map": "dev", "size": 16909336576,
"uuid": "0a438fbc-91e4-427d-8068-1f26330d85cc", "daxregion": {
"id": 1,
"size": 16909336576,
"align": 4096,
"devices": [
{
"chardev": "dax1.0", "size": 16909336576
}
]
},
"numa_node": 1
}
]
}
{
"dev": "region0",
"size": 17179869184,
"available_size": 0,
"max_available_extent": 0, "type": "pmem", "numa_node": 0, "mappings": [
{
"dimm": "nmem0", "offset": 0,
"length": 17179869184,
"position": 0
}
],
"persistence_domain": "unknown", "namespaces": [
{
"dev": "namespace0.0",
"mode": "devdax",
"map": "dev", "size": 16909336576,
"uuid": "38cbd555-3f5b-4f4f-8d83-bf77db75553d", "daxregion": {
"id": 0,
"size": 16909336576,
"align": 4096,
"devices": [
{
"chardev": "dax0.0",
"size": 16909336576
}
]
},
"numa_node": 0
}
]
}
在此範例中,nmem0 位於區域區域 0、命名空間命名空間 0.0 和 DAX 設備 dax0.0 中。
這些步驟的結果是將 iDRAC 中的 A7 與 PFMP 中的 dax0.0 相互關聯。
- 卸下NVDIMM記憶體模組
使用 PowerFlex Manager NVDIMM 更換精靈,從系統卸下 NVDIMM 記憶體模組。
- 登入 PowerFlex Manager。
- 在功能表欄上,單擊“生命週期>資源組”。
- 在 資源組 頁面,按兩下需要更換的資源組,查看 詳情。
- 在詳細資料頁面中,向下捲動至頁面的實體節點區段。
- 在元件更換底下,按一下更換NVDIMM。
PowerFlex Manager 會在 NVDIMM更換精靈中顯示節點清單面板。
- 選取需要更換 NVDIMM 記憶體模組的節點,然後按下 一步。
PowerFlex Manager 會顯示 選取的元件 面板。所有可用的 NVDIMM 記憶體模組會顯示在 NVDIMM 接頭下,而可用的 NVDIMM 電池則會顯示在 NVDIMM 電池下。
- 在 更換 NVDIMM 下,選取您要更換的故障 NVDIMM 記憶體模組,然後按一下 下一步。
由於 NVDIMM 更換程序不可復原,因此會出現訊息,提示您確定節點選擇正確。
- 若要更換 NVDIMM 記憶體模組,請輸入 卸下 NVDIMM。
資源群組頁面上會顯示一則訊息,說明已移除或新增 NVDIMM 裝置,並附上節點和插槽編號。資源組和單個節點的狀態為 「進行中」。記錄詳細資料會顯示在頁面右側 的最近活動區段 中。
隨即建立更換記憶體模組的工作。
- 按一下功能表列右上角 的工作 圖示,以檢視工作的詳細資料。等待工作完成。
- 由 Dell 現場工程師 (FE) 對故障的 NVDIMM 進行實體更換
將 SDS 節點放入 PMM 或 IMM,關閉節點,然後讓 Dell FE 進行故障的 NVDIMM 更換。
-
完成NVDIMM記憶體模組更換
記憶體模組更換完成後,主機和 SVM 會關閉。實體更換記憶體模組後, 資源群組 頁面上的主機狀態會顯示維修模式。此外,在 「動作」下,會顯示 探索替換的 NVDIMM 選項。
先決條件
請確定您已執行 卸下 NVDIMM 記憶體模組中的步驟,然後按照這些步驟完成 NVDIMM 記憶體模組更換作業。
步驟
- 實體更換節點時,請按一下探索更換NVDIMM。
探索更換的 NVDIMM 會開啟節點,並對 NVDIMM 進行系統清除。
- 探索完成後,記錄的狀態會顯示 為已完成。在「動作」下,按一下完成NVDIMM更換選項。
- 按一下 完成 以完成更換程序。
更換 NVDIMM 後,您可以為 NVDIMM 裝置建立虛擬硬體,將 SDS 從維護或維修模式中移除,然後開啟 SVM。
- 新增 NVDIMM 記憶體模組後,資源群組頁面上會顯示 NVDIMM 裝置更換完成訊息。在 「動作」下,按一下 解除 以解除工作。
- 使資源符合性,並使節點恢復作業
更換硬體元件後,請更新系統資源,使資源符合相容性檔案中的韌體和驅動程式。資源合規時,將節點返回到操作。