PowerFlex 4.x PFMPウィザードを使用してNVDIMMを交換する方法
Summary: この記事では、PowerFlex Managerプラットフォーム(PFMP)ウィザードを使用して、PowerEdgeサーバーの障害のあるNVDIMMを交換する方法について説明します。
Instructions
手順
- iDRACで障害のあるNVDIMMモジュールを特定し、PFMPでそのDAXデバイスを関連づける
1 - PowerEdge iDRACから障害が発生したNVDIMMスロットを特定します [Maintenance]タブから、[SystemEventLog]を選択します。

この例では、障害のあるNVDIMMスロットはA7です
2- 影響を受けるSDSノードへのSSHを使用して、障害が発生したNVDIMMシリアル番号を特定し、次のコマンドを実行します。
dmidecode --type memory | grep "Non-" -B 3 -A 3 | grep -E 'Locator|Serial' | grep -v Bank
次のような出力が表示されます。
Locator: A7 Serial Number: 16492521 Locator: B7 Serial Number: 1649251B
この例では、NVDIMM A7 のシリアル番号は 16492521です。
3- サーバーにマウントされているNVDIMMのリストを表示し、シリアル 16492521のdev nmem を見つけます 。
ndctl list -Dvvv | jq '.[].dimms'
次のような出力が表示されます。
[
{
"dev": "nmem1",
"id": "802c-0f-1711-1649251b",
"handle": 4097,
"phys_id": 4370, "state": "disabled", "health": {
"health_state": "ok", "temperature_celsius": 255,
"life_used_percentage": 32
}
},
{
"dev": "nmem0",
"id": "802c-0f-1711-16492521",
"handle": 1,
"phys_id": 4358, "state": "disabled", "health": {
"health_state": "ok", "temperature_celsius": 255,
"life_used_percentage": 32
}
}
]
この例では、 nmem0 はシリアル 16492521の開発です 。
4- 次のコマンドを使用して、nmemマッピング、リージョン、ネームスペース、DAX構成情報を関連づけます。
ndctl list -Dvvv | jq '.[].regions[]'
次のような出力が表示されます。
{
"dev": "region1", "size": 17179869184,
"available_size": 0,
"max_available_extent": 0, "type": "pmem", "numa_node": 1, "mappings": [
{
"dimm": "nmem1", "offset": 0,
"length": 17179869184,
"position": 0
}
],
"persistence_domain": "unknown", "namespaces": [
{
"dev": "namespace1.0",
"mode": "devdax",
"map": "dev", "size": 16909336576,
"uuid": "0a438fbc-91e4-427d-8068-1f26330d85cc", "daxregion": {
"id": 1,
"size": 16909336576,
"align": 4096,
"devices": [
{
"chardev": "dax1.0", "size": 16909336576
}
]
},
"numa_node": 1
}
]
}
{
"dev": "region0",
"size": 17179869184,
"available_size": 0,
"max_available_extent": 0, "type": "pmem", "numa_node": 0, "mappings": [
{
"dimm": "nmem0", "offset": 0,
"length": 17179869184,
"position": 0
}
],
"persistence_domain": "unknown", "namespaces": [
{
"dev": "namespace0.0",
"mode": "devdax",
"map": "dev", "size": 16909336576,
"uuid": "38cbd555-3f5b-4f4f-8d83-bf77db75553d", "daxregion": {
"id": 0,
"size": 16909336576,
"align": 4096,
"devices": [
{
"chardev": "dax0.0",
"size": 16909336576
}
]
},
"numa_node": 0
}
]
}
この例では、nmem0はリージョン領域0、名前空間namespace0.0、およびDAXデバイスdax0.0にあります。
これらの手順の結果、iDRACのA7 とPFMPの dax0.0 を相関させることができます。
- NVDIMMメモリーモジュールを取り外します
PowerFlex Manager NVDIMM交換ウィザードを使用して、システムからNVDIMMメモリー モジュールを取り外します。
- PowerFlex Managerにログインします。
- メニュー バーで、ライフサイクル>リソースグループをクリックします。
- Resource Groupsページで、置き換えが必要なリソース グループをクリックし、View Detailsをクリックします。
- 詳細ページで、ページの物理ノードセクションまで下にスクロールします。
- [ComponentReplacement]で、[NVDIMMReplacement]をクリックします。
PowerFlex Managerは、NVDIMM交換ウィザードにNode Listパネルを表示します。
- NVDIMMメモリー モジュールの交換が必要なノードを選択し、 次へをクリックします。
PowerFlex Managerに Selected Component パネルが表示されます。使用可能なすべてのNVDIMMメモリー モジュールは NVDIMM ヘッダーの下に表示され、使用可能なNVDIMMバッテリーは NVDIMMバッテリーの下に表示されます。
- [NVDIMM Replacement]で、交換する障害のあるNVDIMMメモリー モジュールを選択し、Nextをクリックします。
NVDIMMの交換プロセスは元に戻せないため、ノードの選択が正しいことを確認するよう求めるメッセージが表示されます。
- NVDIMMメモリー モジュールを交換するには、「 REMOVE NVDIMM」と入力します。
NVDIMMデバイスの削除または追加を示すメッセージが、ノード番号とスロット番号とともにResource Groups ページに表示されます。リソース グループと個々のノードのステータスは 、進行中です。ログの詳細は、ページの右側にある 最近のアクティビティ セクションに表示されます。
メモリー モジュールの交換ジョブが作成されます。
- メニュー バーの右上にある [Jobs ]アイコンをクリックして、ジョブの詳細を表示します。ジョブが終了するまで待ちます。
- 障害が発生したNVDIMMの物理的な交換を行うDellフィールド エンジニア(FE)
SDSノードをPMMまたはIMMに配置し、ノードをシャットダウンして、Dell FEに障害のあるNVDIMMの交換を実行させます。
-
NVDIMMメモリーモジュールの交換の完了
メモリー モジュールを交換すると、ホストとSVMの電源がオフになります。メモリー モジュールの物理的な交換後、 Resource Groups ページのホストのステータスにサービス モードが表示されます。また、[ Actions]の下に[ Discover Replacement NVDIMM ]オプションが表示されます。
必要条件
「 NVDIMMメモリー モジュールの取り外し」の手順を実行したことを確認してから、次の手順に従ってNVDIMMメモリー モジュールの交換を完了します。
手順
- ノードを物理的に交換する場合は、交換用NVDIMMの検出をクリックします。
交換用NVDIMMの検出により、ノードの電源がオンになり、NVDIMMのシステム消去が実行されます。
- 検出が完了すると、ログに完了ステータスが表示されます。[Actions]で、[Complete NVDIMMReplacement]オプションをクリックします。
- [Complete]をクリックして交換プロセスを終了します。
NVDIMMを交換した後、NVDIMMデバイスの仮想ハードウェアを作成し、SDSをメンテナンス モードまたはサービス モードから削除して、SVMをオンにすることができます。
- 新しいNVDIMMメモリー モジュールを追加すると、ResourceGroupsページに「The NVDIMM device replacement is complete」というメッセージが表示されます。アクションで、無視をクリックしてタスクを閉じます。
- リソースをコンプライアンス状態にし、ノードを稼働状態に戻す
ハードウェア コンポーネントを交換した後、システム リソースをアップデートして、リソースをコンプライアンス ファイル内のファームウェアとドライバーに準拠させます。リソースが準拠したら、ノードを動作状態に戻します。