Dell VxRail: Integritätsprüfung "ism_fix" oder "rac_fix" zur Behebung von iSM- und iDRAC-Problemen

Summary: VxVerify auf VxRail Manager kann versuchen, iDRAC- und iSM-Fehler durch Neustart von iDRAC und zugehörigen VxRail-Node-Services zu beheben.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

VxVerify auf VxRail Manager kann versuchen, iDRAC- und iSM-Fehler durch Neustart von iDRAC und zugehörigen VxRail-Node-Services zu beheben.
Bevor VxVerify Minion Tests direkt auf jedem Node ausführt, fragt VxVerify auf VxRail Manager zunächst das Dell iSM (dcism oder dellism) ab.
Wenn bei der Ausführung von Integritätsprüfungen iDRAC-Probleme gefunden wurden, wird diese Autokorrektur alternativ versucht, bevor die Integritätsprüfungen erneut durchgeführt werden.
Wenn die Option Autofix aktiviert ist (entweder durch das Testprofil oder mit dem Argument --fix), dauert der Versuch, dies zu korrigieren, etwa 10 Minuten.

Das Ergebnis dieser automatischen Korrektur ist eines der folgenden:
Versuchsergebnis
Ergebniscode
    Interpretation des Ergebnisses
Bestehen
0
Das Korrigieren des iSM-Status war entweder unnötig oder im Testprofil nicht aktiviert.
Warnung
1
Der Dell iSM-Status wurde nach dem Neustart korrekt ausgeführt.
Fehler 2
Dell iSM und iDRAC wurden neu gestartet, aber iSM wurde danach immer noch nicht korrekt ausgeführt.
Kritisch 3
Dieser Test hat kein kritisches Ergebnis.
Diese Korrektur kann auch nach den VxVerify-Prüfungen ausgelöst werden, wenn iDRAC-Abfragen fehlschlagen. In diesem Fall wird VxVerify Minion nach der Korrektur ein zweites Mal ausgeführt. Bei wiederholten Tests wird überprüft, ob iSM- und iDRAC-Probleme behoben sind.
Jeder Test, der bestanden wird, wird aus Gründen der besseren Lesbarkeit nicht im zusammenfassenden Bericht aufgeführt.
Ein Beispiel für die Ausgabe der Integritätsprüfung ist unten dargestellt:
#========================#======#=========#====================================================================#==============#
|  Hostname / Category   |Status  Dell_KB |  Warnings or Failures, unless tests Passed                         ; Product S.N. |
#========================#======#=========#====================================================================#==============#
| _cluster               | Warning 205179 | ism_fix: iSM and iDRAC fixed for node1.lab.local, node4.lab.local                .|
|   ``                   | Warning 205179 | rac_fix: iSM and iDRAC fixed for node2.lab.local                                  |

Der Vorgang "ism_fix" wird vor den Minions ausgeführt und die Korrekturbefehle werden remote von VxRM über SSH ausgeführt. Zum Beispiel:
Running VxVerify 3.21.108, pre-upgrade healthcheck on VxRail 7.0.372.
In case of program errors consult article https://www.dell.com/support/kbdoc/000066460.
Step 1: Fixing iSM issue, prior to running health-checks, on node: lab-08-esxi-01.lab.local
Step 1: Fixing iSM issue, prior to running health-checks, on node: lab-08-esxi-02.lab.local
Step 1: Stopping ISM and platform service on lab-08-esxi-01.lab.local
Step 1: Stopping ISM and platform service on lab-08-esxi-02.lab.local
Step 1: Pausing for 266 seconds more after iDRAC restarted on ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local'] 
... 
Step 1: Starting iSM on lab-08-esxi-01.lab.local
Step 1: Starting iSM on lab-08-esxi-02.lab.local
Step 1: Pausing for 84 seconds more after Dell iSM started on ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local']
...
Step 1: Starting Platform service on lab-08-esxi-01.lab.local
Step 1: Starting Platform service on lab-08-esxi-02.lab.local
Der Autofix wird auch in der vxv.log vor dem minion_run Ereignisse angezeigt:
2022-11-11 09:51:26-INFO     [ism_fix] Fixing phase 1 Dell ISM on node on lab-08-esxi-01.lab.local
2022-11-11 09:51:31-INFO     [ism_fix] lab-08-esxi-01.lab.local Auto-fix continuing with vSAN objecthealth: green
2022-11-11 09:51:32-INFO     [ism_fix] iDRAC restarting on lab-08-esxi-01.lab.local: _
...
2022-11-11 09:58:58-INFO     [ism_fix] Checking hosts for auto-fix success: ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local']

Cause

Um zu korrigieren, dass dcism nicht ausgeführt wird, führen Sie die folgenden Schritte durch VxVerify aus, wenn diese automatische Korrekturfunktion im Testprofil aktiviert ist:
  • Stoppen Sie Services: sfcbd, dcism, PTAgent (falls vorhanden) und Platform-service
  • Starten Sie iDRAC neu und warten Sie 5 Minuten, bis iDRAC wieder online ist
  • Starten von Services (siehe oben)

Resolution

Der Autofix für iSM meldet den Erfolg oder Fehlschlag abhängig vom Status "dcism" oder "dellism", wenn er remote von VxVerify abgefragt wird. Die Minions werden dann wie gewohnt gestartet.
Der iSM-Status wird mithilfe der Integritätsprüfung "dcism" direkt auf diesem Node erneut getestet. Dies kann ein anderes Ergebnis melden, da dies einige Minuten nach dem Autofix abgefragt wird. Wenn das Ergebnis abweicht, sollte der "dcism"-Test als das genauere Ergebnis für den Status des iSM angesehen werden.

Die Ergebnisse der Befehle zum Starten der Dienste finden Sie im vxv.log (siehe Artikel 66460: VxVerify-Troubleshooting-Handbuch ).
2022-11-25 09:16:26-DEBUG    [ism_fix] node-04.lab.local iSM start: _
2022-11-25 09:18:26-DEBUG    [ism_fix] node-04.lab.local Platform service start: Starting Platform Service Daemon. Check hostd status. hostd is ready. Platform Service started.
2022-11-25 09:18:26-INFO     [ism_fix] Checking hosts for auto-fix success: ['node-04.lab.local']
2022-11-25 09:18:26-INFO     [ism_check] Querying DC or Dell ISM status on host
2022-11-25 09:18:26-INFO     [ism_check] iSM status on node-04.lab.local : iSM is active (running)

Wenn iSM nicht durch die oben genannten Schritte behoben werden kann, die die Integritätsprüfung automatisch ausführen kann, lesen Sie den folgenden Artikel: Dell VxRail: Node-Integritätsprüfung schlägt für Test „dcism“ fehl

Additional Information

Einsatz von ism_fix erzwingen (iDRAC-Neustart)

Autofix wird ausgeführt, wenn "dcism" oder "dellism" nicht ausgeführt werden, wenn sie von VxRM abgefragt werden. Dies gilt jedoch nur, wenn das Testprofil oder das Argument --fix die automatische Korrektur aktiviert.
Alternativ kann ein iDRAC-Neustart empfohlen werden, um andere Probleme zu beheben, sodass Autofix über ein VxVerify-Argument aktiviert werden kann. 
Dies ist eine sicherere Methode zur Wiederherstellung der iDRAC-Kommunikation als ein Neustart direkt über die iDRAC-Benutzeroberfläche, da VxVerify das iSM und die zugehörigen Services vor dem Neustart des iDRAC herunterfährt und die Services anschließend in der richtigen Reihenfolge wieder hochfährt.
Das Überschreibungsargument kann entweder einen gestaffelten iDRAC-Neustart aller Nodes anfordern oder eine Liste bestimmter Nodes anfordern.

So wenden Sie die Korrektur auf Nodes an (auch wenn iSM normal ausgeführt wird), wodurch iDRAC und die zugehörigen Dienste neu gestartet werden:

  • Wenden Sie entweder das iSM- und iDRAC-Neustartverfahren ('ism_fix) auf alle Nodes an:

./vxverify.sh -a ism_fix=all​​​
  • Oder wenden Sie "ism_fix" auf bestimmte Nodes in einer Liste an (ohne Leerzeichen) (entweder kurze oder vollständig qualifizierte Namen funktionieren):

python vxverify3.pyc <any_other_arguments> -a ism_fix=lab-08-esxi-01,lab-08-esxi-02

Die obigen Beispiele zeigen die Shell- und Python-Methoden zum Ausführen von VxVerify, aber die Argumente funktionieren mit beiden Syntaxen.
Das Argument -a (--additional-params) erlaubt die Angabe einer unbegrenzten Anzahl von Argumentpaaren, so dass es nach allen anderen Standardargumenten wie --verbose stehen muss

Wenn dieses Argument verwendet wird, kann die Überschreibung im vxv.log wie folgt angezeigt werden:

INFO [ism_fix] Running fix for Dell ISM on node: lab-08-esxi-01, due to override argument: lab-08-esxi-01.lab.local,lab-08-esxi-02.lab.local
or 
INFO [ism_fix] Running fix for Dell ISM on node: lab-08-esxi-02, due to override argument: all 

Affected Products

VxRail, iDRAC Service Module, VxRail Appliance Family, VxRail Appliance Series, VxRail Software
Article Properties
Article Number: 000205179
Article Type: Solution
Last Modified: 18 Dec 2024
Version:  12
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.