PowerFlex:PowerFlexカスタム(R650、R750)ノードでNVDIMMバッテリーの充電が失われる問題を軽減するためにファームウェアをアップデートする手順
Summary: PowerFlexカスタム(R650とR750)ノードでNVDIMMバッテリーの充電が失われる問題を軽減するためにファームウェアをアップデートする手順。
Instructions
Issue Description
Dell PowerFlex 15Gシステムは、Fine Granularity機能に必要なパーシステント メモリーを提供するNVDIMMを含む構成をサポートします。この手順では、iDRACおよびCPLDを次のバージョンにアップデートする手順について説明します。
- iDRAC 7.10.50.201
- CPLD 1.1.1
ダウンロードの場所
- PowerFlexカスタム ノード:https://www.dell.com/support/home/en-us/product-support/product/powerflex-custom-node/drivers
- (iDRACとCPLDを検索)
新しいiDRACバージョンは、有効にするとNVDIMMバッテリー セルの電圧をチェックします。セルの電圧が定義された閾値を下回っている場合、エラーがログに記録されます。NVDIMMバッテリーのステータスが[READY]と[ENABLED]の間で切り替わると、重要度「info」のイベントがログに記録されます。
新しいCPLD設計では、NVDIMMバッテリーの[ENABLED]状態がトラッキングされ、一定時間が経過すると[READY]状態に戻ります。
- メモ: 前掲の問題の結果として、ノードのNVDIMMバッテリーが損傷する可能性があり、交換する必要があります。この手順は、この可能性を考慮したものです。
- メモ: このiDRACおよびCPLDのアップデートは、特定の順序に従う必要があります。このシーケンスでは、最初にiDRACをアップグレードし、その後にCPLDをアップデートする必要があります。これは、バッテリーに障害が発生したかどうかを識別するのに役立ちます。
手順の概要
この問題に完全に対処するには、以下のことを行う必要があります。
- システム内のどのNVDIMMバッテリーの充電が不足しているかを特定します。
- この具体的な状態は報告されていないため、iDRACを前掲(またはそれ以上)のバージョンにアップデートする必要があります。この新しいバージョンのiDRACは、放電しているNVDIMMバッテリーを検出すると、BAT0021またはBAT0017エラーを報告します。
- システム内のすべてのノードで示されているバージョンにiDRACをアップデートします。
- 放電して不良と報告されたすべてのNVDIMMバッテリーについて、交換を要求します。
- 不良NVDIMMバッテリーを交換するまで、不良バッテリーのあるノードでのCPLDアップデートを続行しないでください。
- 交換用バッテリーは完全に充電されていないことがあり、取り付け後に完全に充電されるまでに最大75分かかる場合があります。
- 正常なNVDIMMバッテリーが搭載されているノードでは、CPLD FWのアップデートに進むことができます。
- 不良バッテリーを交換した後、iDRACを使用してCPLDファームウェアのアップデートに進みます。
- アップデートを完了する前に、ノードをメンテナンス モードにする必要があります。
- ノードが再起動し、CPLDアップデートが実行されます。
- CPLDのアップデート後にノードが再起動したら、ノードをメンテナンス モードから解除します。
- メンテナンス モードを解除すると、ノードの再構築と再バランシングが開始されます。
- メモ: 再構築と再バランシングが完了するまで待ってから、クラスター内の次のノードのアップデートに進んでください。
必要条件
- このCPLDアップデートのBIOSの最小バージョンは、BIOSバージョン1.8.2です (1.10.2以上を推奨)。
- コンポーネント交換手順中、お客様は次のタスクを実行する責任があります。
- ノード上のPowerFlex以外のアプリケーションを別のサーバーに移行する。
- 使用中のオペレーティング システムの適切なシャットダウン手順に従って、サーバーを正常にシャットダウンする。
- 次の情報が利用可能であることを確認します。
- PowerFlexノードのタイプ:物理ノードまたはHCI (VMware)ノード
- PowerFlexクラスターとそのノードのIPアドレス範囲、サブネット、ゲートウェイIPアドレス
- ノード上のiDRACポートのIPアドレス範囲、サブネット、ゲートウェイIPアドレス(初期導入プロセス中に定義)
- サーバーとiDRACに設定されているすべてのルート パスワードと管理者パスワード
- vCenterのIPアドレスとログイン認証情報(構成がHCIの場合)
詳細な手順
手順1:PowerFlexクラスター内のすべてのノードでiDRACをアップデートする
これらのノードのiDRACは、ノードを再起動せずにアップデートできます。iDRACをアップデートする手順を以下に示します。
ローカル システムの特定の場所にファームウェア イメージがダウンロードされていることを確認してください。この手順にはiDRACのファームウェア バージョンが必要であり、ダウンロード場所は手順の最初のページに表示されます。
メモ:手順の次のステップに進む前に、クラスター内のすべてのノードでiDRACファームウェアがアップデートされていることを確認してください。
- iDRAC9 Webインターフェイスにログインします。
- [メンテナンス]に移動し、[システムの更新プログラム]をクリックします。[手動アップデート]ページが表示されます。
- [手動アップデート]タブから、[場所のタイプ]で[ローカル]を選択します。
図1:iDRAC9のアップデート画面
- [ファイルを選択]をクリックして、必要なコンポーネントのファームウェア イメージ ファイルを選択して、[アップロード]をクリックします。
- アップロードが完了すると、[アップデート詳細]セクションにiDRACにアップロードされた各ファームウェア ファイルとそのステータスが表示されます。ファームウェア イメージ ファイルが有効で、正常にアップロードされた場合は、[コンテンツ]列のファームウェア イメージ ファイル名の横に、(+)アイコンが表示されます。名前を展開すると、[デバイス名]、[現在]、および[使用可能なファームウェアバージョン]の情報が表示されます。
- 必要なiDRACファームウェア ファイルを選択します。
- iDRACファームウェア アップデートでは、ホスト システムを再起動する必要はありません。[インストール]をクリックして、アップデートを開始します。
- [ジョブ キュー]ページを表示するには、[ジョブ キュー]をクリックします。このページは、保留中のファームウェア アップデートの表示および管理に使用します。[OK]をクリックして現在のページを更新し、ファームウェア アップデートのステータスを表示することができます。
- ライフ サイクル コントローラーが再起動し、iDRACへの接続がリセットされます。iDRACにログインするまで数分お待ちください。
メモ: 接続エラーが発生した場合は、「HTTPおよびHTTPS FQDN接続の失敗」に関するKB (https://www.dell.com/support/kbdoc/en-us/000193619)を参照してください。
手順2:ノードに不良なNVDIMMバッテリーがあるかどうかを確認する
iDRAC 7.10.50.201以降には、NVDIMMバッテリー セルの充電を5秒ごとにチェックするコードが含まれており、セル電圧が1.5vのしきい値を下回っている場合にiDRACシステム イベント ログ(SEL)に次のエラーが報告されます。
“BAT0021: The NVDIMM battery has reached the end of its usable life or has failed”“BAT0017: The NVDIMM battery has failed.”
前掲のメッセージのいずれかが報告された場合は、ノードに不良なNVDIMMバッテリーがあり、交換が必要であることを意味します。
- メモ: 不良なNVDIMMバッテリーを使用して、このノードのCPLDのアップデートに進まないでください。CPLDのアップデート中に再起動すると、バッテリーの不良が原因でハングアップし、NVDIMMが作動しません。
- メモ: 交換用NVDIMMバッテリーを要求してください。
iDRACが問題を報告しない場合、このノードのバッテリーは正常であり、交換する必要はありません。このノードでCPLDのアップデートを実行し、次の手順に進むことができます。
-
メモ: PowerFlex設計のシステムは、BAT0021エラーを示しているノードについて、ノードの正常性に関する警告を報告します。 この動作は、iDRACのアップデート後に障害が発生したNVDIMMバッテリーを特定するために使用できます
-
メモ: BAT0017またはBAT0021イベントが表示され、その後、BAT0016の3回目のイベントが発生した場合は、バッテリー を交換する必要はありません
NVDIMMエンジニアリングは、この3番目のイベント(BAT0016)が発生した場合、バッテリーを交換する必要はないとアドバイスしました。BAT0016 The NVDIMM battery is operating normally.
3つのバッテリー アラート(BAT0021、BAT0020、BAT0016)がすべて1分以内に順番に表示された場合、これは誤ったアラームと見なされ、バッテリーは正常であると見なされ、交換されません。
手順3:ノードの準備 - SDSをメンテナンス モードにする
- 以下の、PowerFlexバージョン4.xまたはPowerFlexバージョン3.xのセクションに記載された適切な手順に従って、メンテナンス モードに入ります。
- 正しいPowerFlexメンテナンス モードの選択
- ノードに不良なNVDIMMバッテリーがない場合は、インスタント メンテナンス モード(IMM)を使用してCPLDをアップデートすることをお勧めします。
- 手順4と5(バッテリーの交換)をスキップして、BIOS(手順6)とCPLD(手順7)のアップグレードに進みます。
- ノードに不良なNVDIMMバッテリーがある場合は、CPLDをアップデートする前に交換する必要があります。
- この場合、交換用バッテリーの充電にかかる時間を考慮して、ノードを保護メンテナンス モード(PMM)にする必要があります。
- ノードに不良なNVDIMMバッテリーがない場合は、インスタント メンテナンス モード(IMM)を使用してCPLDをアップデートすることをお勧めします。
- メモ: この手順を実行すると、再バランシング プロセスが開始されるため、スケジュールされたメンテナンス期間にこの手順を計画することをお勧めします。
- メモ: NVDIMMバッテリーの交換(手順4〜5)の前にPMMを使用している場合は、BIOSおよびCPLDのアップデート(手順6〜7)のためにPMMメンテナンス モードを維持できます。
PowerFlexバージョン4.xについては、『Dell PowerFlex 4.x管理ガイド』を参照してください。
- ノードがプライマリーMDMとして機能している場合は、次の手順に従ってMDM所有権を切り替えます。
- ノードでSDRが構成されている場合は、SDRをメンテナンス モードにします
- Storage Data Server (SDS)をメンテナンス モードにします
- これがHCI (VMware)ノードの場合は、前掲の手順の後にESXiをメンテナンス モードにします
PowerFlexバージョン3.xについては、『Upgrade Dell PowerFlex to v3.6.x』ガイドを参照してください。
- ノードをメンテナンス モードにしてシャットダウンする
手順4:NVDIMMバッテリーを交換する
NVDIMMバッテリーを交換する手順については、次のリンクから入手できるPowerFlexノードのSolVeドキュメントを参照してください。
15Gの適切なノード タイプR650/R750の「NVDIMMバッテリー」のSolVeドキュメントをダウンロードします。PowerFlex Custom Node > Replacement > 15G > [R650 or R750] > [PowerFlex 3.6 or 4.0] > NVDIMM battery - Linux-based
-
メモ: 「NVDIMMバッテリーの交換」ドキュメントの次のセクションはスキップしてください。
Remove the storage devices from PowerFlex.
ストレージ デバイスを取り外すべきでない理由:
- この手順の実行中にストレージ デバイスを取り外すと、ノード全体が不必要に再構築され、メンテナンスが大幅に延長されます。
- これは計画的な再起動であり、電源喪失イベントではないため、NVDIMMサブシステムは保存操作を完了するためにバッテリーからの電力に依存しません。バッテリーが不良の場合でも、電源はPSUから供給されます。
- 再起動すると、電源投入時にNVDIMMバッテリーのエラーが報告されます。ただし、NVDIMM内のデータは保存されており、データが失われることはありません。
手順5:交換したバッテリーが充電されるまで待つ
特定のノードでNVDIMMバッテリーを交換した場合は、システムの電源を入れてください。システムは完全に起動しません。交換用NVDIMMバッテリーには、NVDIMM内のデータを保護するためにシステムが必要とする十分な充電量がない可能性があるため、BIOSはバッテリーの充電待ちを停止します。バッテリーの充電には約60〜75分かかる場合があります。60~75分後にシステムを再起動してみると、ノードの電源がオンになり、NVDIMMサブシステムも作動するはずです。
- メモ: バッテリーの交換が必要なすべてのノードについて、60~75分を基準にメンテナンス期間を計画してください。
手順6:必要に応じてBIOSをアップデートする
このKBの基盤となる問題の修正に使用するCPLDバージョンには、1.8.2以降のBIOSが必要です(BIOS 1.10.2以上を推奨)。
PowerFlexカスタム ノードの導入には、Dellによって検証および認定された特定のバージョンのドライバー、BIOS、ファームウェアが必要です。
現在のBIOSバージョンが1.8.2未満の場合は、『PowerFlex Custom Node Driver and Firmware Matrix』で公開されている最新バージョンにファームウェアをアップデートします。
- ノードがメンテナンス モードになっていることを確認します。そうでない場合は、「手順3」を参照してください。
- BIOSバージョンのダウンロードについては、このKBの「ダウンロードの場所」を参照してください。
- メモ: [Older Versions]をクリックして、対象となるマトリックスに合わせてバージョンを選択します。
- BIOSのバージョン1.8.2以降へのアップグレードに進みます。
- 15G用のDell PowerEdge BIOSアップグレード手順: https://www.dell.com/support/kbdoc/en-us/000222827/dell-technologies-recommends-upgrading-bios-and-idrac9-for-15th-generation-poweredge-servers
手順7:CPLDをバージョン1.1.1にアップデートする
前提条件:
- SDSがPowerFlexメンテナンス モードになっていることを確認します。ESXiノードの場合は、ESXiもメンテナンス モードになっていることを確認します。それ以外の場合は、この記事の「手順3」を参照してください。
- CPLDファームウェア イメージがローカル システムで使用可能であることを確認します。適切なCPLDバージョンをダウンロードするには、この記事の「ダウンロードの場所」を参照してください。
- CPLDのアップデートにより、ノードの再起動がトリガーされます。
注:
- iDRACファームウェアのアップデート後に、CPLDファームウェア アップデートを実行します。
- CPLDファームウェア アップデートに進む前に、NVDIMMバッテリーを交換してください。
CPLDのアップデート手順は次のとおりです。
- iDRAC9 Webインターフェイスにログインします。
- [メンテナンス]に移動し、[システムの更新プログラム]をクリックします。[手動アップデート]ページが表示されます。
- [手動アップデート]タブから、[場所のタイプ]で[ローカル]を選択します。
図1:iDRAC9のアップデート画面 - [ファイルを選択]をクリックして、必要なコンポーネントのファームウェア イメージ ファイルを選択して、[アップロード]をクリックします。
- アップロードが完了すると、[アップデート詳細]セクションにiDRACにアップロードされた各ファームウェア ファイルとそのステータスが表示されます。ファームウェア イメージ ファイルが有効で、正常にアップロードされた場合は、[コンテンツ]列のファームウェア イメージ ファイル名の横に、(+)アイコンが表示されます。名前を展開すると、[デバイス名]、[現在]、および[使用可能なファームウェアバージョン]の情報が表示されます。
- 必要なCPLDファームウェア ファイルを選択します。
- CPLDファームウェアのアップデートでは、ホスト システムの再起動が必要です。[インストール]をクリックして、アップデートを開始します。
- [ジョブ キュー]ページを表示するには、[ジョブ キュー]をクリックします。このページは、保留中のファームウェア アップデートの表示および管理に使用します。[OK]をクリックして現在のページを更新し、ファームウェア アップデートのステータスを表示することができます。
手順8:ノードをメンテナンス モードから解除する
PowerFlexバージョン4.xについては、『Dell PowerFlex 4.x管理ガイド』を参照してください。
前提条件:PowerFlex ManagerにアクセスするためのIPアドレスと管理者ログイン認証情報があることを確認します。必要に応じて、お客様から必要な情報を得られます。
-
CPLDのアップデート後にノードの電源をまだオンにしていない場合は、オンにします。オペレーティング システムが起動し、すべてのPowerFlexプロセスが自動的に起動します。
-
ノードが起動したら、ブラウザーから管理者ユーザーとしてPowerFlex Managerに再度ログインします。
-
メニュー バーで、[Monitoring]>[Alerts]をクリックし、SDSまたはSDCホスト、SDRまたはSDT(該当する場合)の切断メッセージが表示されていないことを確認します。
- ESXiノードの場合は、次の手順を実行します。
- vSphere Web Clientから、[ホスト]ビューと[クラスター]ビューの両方で、ノードがオンとして表示され、接続されていることを確認します。
- ノードを右クリックし、[メンテナンス モードの終了]を選択します。
- サーバーを展開し、Storage VM (SVM)を選択します。SVMの電源が自動的にオンにならない場合は、手動で電源をオンにします。
- SDSをメンテナンス モードから終了します。
- ノードでSDRが構成されている場合は、SDRをメンテナンス モードから解除します。
PowerFlexバージョン3.xについては、『Upgrade Dell PowerFlex to v3.6.x』ガイドを参照してください。
前提条件:ユーザーが次の認証情報(管理者から入手可能)を持っていることを確認します。PowerFlex GUIへのアクセスに使用されるPowerFlexプレゼンテーション サーバーのIPアドレスまたはホスト名
- CPLDのアップデート後にノードの電源をまだオンにしていない場合は、オンにします。オペレーティング システムが起動し、すべてのPowerFlexプロセスが自動的に起動します。
- ノードをメンテナンス モードから終了します。 ノードを動作状態に戻す
- ノードでSDRが構成されている場合は、SDRをメンテナンス モードから解除します。
手順9:クラスター内の次のノードに進む
手順2から手順8のシーケンスは、クラスター内のすべてのノードに対して一度に1つずつ実行する必要があります。 すべてのノードがアップグレードされると、プロセスが完了します。