Dell VxRail: iSMおよびiDRACの問題を修正するヘルス チェック「ism_fix」または「rac_fix」

Summary: VxRail Manager上のVxVerifyは、iDRACおよび関連するVxRailノード サービスを再起動することで、iDRACとiSMの障害の修正を試みることができます。

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

VxRail Manager上のVxVerifyは、iDRACおよび関連するVxRailノード サービスを再起動することで、iDRACとiSMの障害の修正を試みることができます。
VxVerify minionを使用して各ノードで直接テストを実行する前に、VxRail Manager上のVxVerifyはまずDell iSM(dcismまたはdellism)にクエリーを実行します
または、ヘルス チェックの実行時にiDRACの問題が見つかった場合は、ヘルス チェックを再試行する前にこのAutofixが試行されます。
自動修正オプションが(テストプロファイルまたは引数--fixによって)有効になっている場合、この修正には約10分かかります。

この自動修正の結果は、次のいずれかとして一覧表示されます。
テスト結果
結果コード
    結果の解釈
成功する
0
iSMステータスの修正が不要であったか、またはテスト プロファイルで有効になっていませんでした。
警告
1
再起動後、Dell iSMのステータスは正しく実行されていました。
Failure 2
Dell iSMとiDRACが再起動されましたが、iSMが正常に実行されていませんでした。
重大な 3
このテストでは重大な結果は得られません。
iDRACクエリーが失敗した場合、VxVerifyチェックの実行後にこの修正をトリガーすることもできます。その場合、VxVerify minionは修正後に2回目に実行されます。繰り返しテストでは、iSMおよびiDRACの問題が修正されているかどうかを確認します。
合格した各テストは、読みやすくするためにサマリー レポートには表示されません
ヘルスチェックの出力例を次に示します。
#========================#======#=========#====================================================================#==============#
|  Hostname / Category   |Status  Dell_KB |  Warnings or Failures, unless tests Passed                         ; Product S.N. |
#========================#======#=========#====================================================================#==============#
| _cluster               | Warning 205179 | ism_fix: iSM and iDRAC fixed for node1.lab.local, node4.lab.local                .|
|   ``                   | Warning 205179 | rac_fix: iSM and iDRAC fixed for node2.lab.local                                  |

「ism_fix」操作はminionの前に実行され、修正コマンドはSSHを使用してVxRMからリモートで実行されます。例:
Running VxVerify 3.21.108, pre-upgrade healthcheck on VxRail 7.0.372.
In case of program errors consult article https://www.dell.com/support/kbdoc/000066460.
Step 1: Fixing iSM issue, prior to running health-checks, on node: lab-08-esxi-01.lab.local
Step 1: Fixing iSM issue, prior to running health-checks, on node: lab-08-esxi-02.lab.local
Step 1: Stopping ISM and platform service on lab-08-esxi-01.lab.local
Step 1: Stopping ISM and platform service on lab-08-esxi-02.lab.local
Step 1: Pausing for 266 seconds more after iDRAC restarted on ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local'] 
... 
Step 1: Starting iSM on lab-08-esxi-01.lab.local
Step 1: Starting iSM on lab-08-esxi-02.lab.local
Step 1: Pausing for 84 seconds more after Dell iSM started on ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local']
...
Step 1: Starting Platform service on lab-08-esxi-01.lab.local
Step 1: Starting Platform service on lab-08-esxi-02.lab.local
Autofixは、minion_runイベントの前にvxv.logにも表示されます。
2022-11-11 09:51:26-INFO     [ism_fix] Fixing phase 1 Dell ISM on node on lab-08-esxi-01.lab.local
2022-11-11 09:51:31-INFO     [ism_fix] lab-08-esxi-01.lab.local Auto-fix continuing with vSAN objecthealth: green
2022-11-11 09:51:32-INFO     [ism_fix] iDRAC restarting on lab-08-esxi-01.lab.local: _
...
2022-11-11 09:58:58-INFO     [ism_fix] Checking hosts for auto-fix success: ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local']

Cause

この自動修復機能が テスト プロファイルで有効になっている場合は、VxVerifyによって実行されていないdcismを修正するために次の手順を実行します。
  • サービスの停止:sfcbd、dcism、PTAgent(存在する場合)およびPlatform-service
  • iDRACを再起動し、iDRACがオンラインに戻るまで5分間待ちます
  • サービスの開始(上記を参照)

Resolution

iSMのAutofixは、VxVerifyによってリモートでポーリングされたときに、「dcism」または「dellism」のステータスに応じて成功または失敗を報告します。その後、ミニオンは通常どおり起動します
iSMのステータスは、そのノードで「dcism」ヘルス チェックを直接使用して再テストされます。これは、Autofixの数分後にポーリングされるため、異なる結果を報告する可能性があります。結果が異なる場合は、「dcism」テストをiSMのステータスに関するより正確な結果と見なす必要があります

サービスを開始するためのコマンドの結果は、vxv.logに記載されています(記事 66460: VxVerifyトラブルシューティング ガイド )。
2022-11-25 09:16:26-DEBUG    [ism_fix] node-04.lab.local iSM start: _
2022-11-25 09:18:26-DEBUG    [ism_fix] node-04.lab.local Platform service start: Starting Platform Service Daemon. Check hostd status. hostd is ready. Platform Service started.
2022-11-25 09:18:26-INFO     [ism_fix] Checking hosts for auto-fix success: ['node-04.lab.local']
2022-11-25 09:18:26-INFO     [ism_check] Querying DC or Dell ISM status on host
2022-11-25 09:18:26-INFO     [ism_check] iSM status on node-04.lab.local : iSM is active (running)

上記の手順でiSMを修復できない場合は、ヘルスチェックが自動的に実行されます。この場合は、次の記事を参照してください。Dell VxRail:テスト「dcism」でノードのヘルス チェックが失敗する

Additional Information

ism_fixの使用を強制する(iDRACの再起動)

「dcism」または「dellism」が実行されていない場合、VxRMからクエリーが実行されると、Autofixが実行されます。ただし、これは、テスト プロファイルまたは--fix引数でAutofixが有効になっている場合にのみ適用されます
または、他の問題に対処するためにiDRACの再起動が推奨される場合があります。これにより、VxVerify引数を介してAutofixを有効にできます。
これは、iDRAC UIから直接再起動するよりも、iDRAC通信を安全に回復する方法です。VxVerifyはiDRACを再起動する前にiSMと関連サービスをシャットダウンし、その後サービスを正しい順序で再開します
override引数では、すべてのノードでiDRACの再起動を段階的に要求するか、特定のノードのリストを要求することができます。

(iSMが正常に実行されている場合でも)ノードに修正を適用すると、iDRACと関連サービスが再起動されます。

  • iSMおよびiDRACの再起動手順(「ism_fix」)をすべてのノードに強制的に適用します。

./vxverify.sh -a ism_fix=all​​​
  • または、 リスト内の指定されたノード に 'ism_fix' を適用します (スペースなし) (短い名前または完全修飾名が機能します)。

python vxverify3.pyc <any_other_arguments> -a ism_fix=lab-08-esxi-01,lab-08-esxi-02

上記の例は、VxVerifyを実行するためのシェルとPythonの方法を示していますが、引数はどちらの構文でも機能します
-a 引数 (--additional-params) では、無制限の数の引数ペアを指定できるため、--verbose などの他のすべての標準引数の後に指定する必要があります

この引数を使用すると、オーバーライドは次のようにvxv.logに表示されます。

INFO [ism_fix] Running fix for Dell ISM on node: lab-08-esxi-01, due to override argument: lab-08-esxi-01.lab.local,lab-08-esxi-02.lab.local
or 
INFO [ism_fix] Running fix for Dell ISM on node: lab-08-esxi-02, due to override argument: all 

Affected Products

VxRail, iDRAC Service Module, VxRail Appliance Family, VxRail Appliance Series, VxRail Software
Article Properties
Article Number: 000205179
Article Type: Solution
Last Modified: 18 Dec 2024
Version:  12
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.