Dell VxRail: hälsokontroll "ism_fix" eller "rac_fix" som korrigerar iSM- och iDRAC-problem

Summary: Med VxVerify på VxRail Manager kan du försöka korrigera iDRAC- och iSM-fel genom att starta om iDRAC och relaterade VxRail-nodtjänster.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Med VxVerify på VxRail Manager kan du försöka korrigera iDRAC- och iSM-fel genom att starta om iDRAC och relaterade VxRail-nodtjänster.
Innan tester körs direkt på varje nod frågar VxVerify på VxRail Manager först Dell iSM (dcism eller dellism) med hjälp av VxVerify-minion.
Alternativt, om iDRAC-problem påträffades när hälsokontroller kördes, görs ett försök med denna Autofix innan ett nytt försök görs med hälsokontrollerna.
Om alternativet Autofix är aktiverat (antingen av testprofilen eller med argumentet --fix) tar det cirka 10 minuter att korrigera detta.

Resultatet av den här automatiska korrigeringen visas som något av följande:
Testresultat
Resultatkod
    Tolkning av resultat
Lyckas
0
Korrigering av iSM-status var antingen onödig eller aktiverad inte under testprofilen.
Varning
1
Dell iSM-status kördes korrekt efter omstart.
Misslyckande 2
Dell iSM och iDRAC startades om, men iSM kördes fortfarande inte korrekt efteråt.
Kritisk 3
Det här testet har inget kritiskt resultat.
Den här korrigeringen kan även utlösas efter att VxVerify-kontrollerna har körts om iDRAC-frågor misslyckas. I så fall körs VxVerify-minionen en andra gång efter korrigeringen. De upprepade testerna kontrollerar om iSM- och iDRAC-problemen är åtgärdade.
Alla tester som godkänns visas inte i den sammanfattande rapporten för att underlätta läsningen.
Ett exempel på hälsokontrollens utdata visas nedan:
#========================#======#=========#====================================================================#==============#
|  Hostname / Category   |Status  Dell_KB |  Warnings or Failures, unless tests Passed                         ; Product S.N. |
#========================#======#=========#====================================================================#==============#
| _cluster               | Warning 205179 | ism_fix: iSM and iDRAC fixed for node1.lab.local, node4.lab.local                .|
|   ``                   | Warning 205179 | rac_fix: iSM and iDRAC fixed for node2.lab.local                                  |

ism_fix-åtgärden körs före minionerna och korrigeringskommandona fjärrkörs från VxRM med SSH. Till exempel:
Running VxVerify 3.21.108, pre-upgrade healthcheck on VxRail 7.0.372.
In case of program errors consult article https://www.dell.com/support/kbdoc/000066460.
Step 1: Fixing iSM issue, prior to running health-checks, on node: lab-08-esxi-01.lab.local
Step 1: Fixing iSM issue, prior to running health-checks, on node: lab-08-esxi-02.lab.local
Step 1: Stopping ISM and platform service on lab-08-esxi-01.lab.local
Step 1: Stopping ISM and platform service on lab-08-esxi-02.lab.local
Step 1: Pausing for 266 seconds more after iDRAC restarted on ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local'] 
... 
Step 1: Starting iSM on lab-08-esxi-01.lab.local
Step 1: Starting iSM on lab-08-esxi-02.lab.local
Step 1: Pausing for 84 seconds more after Dell iSM started on ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local']
...
Step 1: Starting Platform service on lab-08-esxi-01.lab.local
Step 1: Starting Platform service on lab-08-esxi-02.lab.local
Autorättningen kan också ses i vxv.log före händelserna i minion_run:
2022-11-11 09:51:26-INFO     [ism_fix] Fixing phase 1 Dell ISM on node on lab-08-esxi-01.lab.local
2022-11-11 09:51:31-INFO     [ism_fix] lab-08-esxi-01.lab.local Auto-fix continuing with vSAN objecthealth: green
2022-11-11 09:51:32-INFO     [ism_fix] iDRAC restarting on lab-08-esxi-01.lab.local: _
...
2022-11-11 09:58:58-INFO     [ism_fix] Checking hosts for auto-fix success: ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local']

Cause

För att korrigera dcism som inte körs utför du följande steg genom VxVerify, om den här funktionen för automatisk reparation är aktiverad i testprofilen:
  • Stopptjänster: sfcbd, dcism, PTAgent (om sådan finns) och plattformstjänst
  • Starta om iDRAC och vänta sedan i 5 minuter tills iDRAC är online igen
  • Starta tjänster (anges ovan)

Resolution

Autokorrigeringen för iSM rapporterar lyckade eller misslyckade avsökning beroende på status för "dcism" eller "dellism" när den avsöks via fjärråtkomst av VxVerify. Minionerna startas sedan som vanligt.
iSM-statusen testas på nytt med hjälp av dcism-hälsokontrollen direkt på noden. Detta kan rapportera ett annat resultat, eftersom detta avsöks några minuter efter autokorrigeringen. Om resultatet skiljer sig åt bör "dcism"-testet ses som det mer exakta resultatet för statusen för iSM.

Resultatet av kommandona för att starta tjänsterna finns i vxv.log (se artikel 66460: Felsökningsmanual för VxVerify ).
2022-11-25 09:16:26-DEBUG    [ism_fix] node-04.lab.local iSM start: _
2022-11-25 09:18:26-DEBUG    [ism_fix] node-04.lab.local Platform service start: Starting Platform Service Daemon. Check hostd status. hostd is ready. Platform Service started.
2022-11-25 09:18:26-INFO     [ism_fix] Checking hosts for auto-fix success: ['node-04.lab.local']
2022-11-25 09:18:26-INFO     [ism_check] Querying DC or Dell ISM status on host
2022-11-25 09:18:26-INFO     [ism_check] iSM status on node-04.lab.local : iSM is active (running)

Om iSM inte kan åtgärdas med stegen ovan, som hälsokontrollen kan köra automatiskt, läser du artikeln: Dell VxRail: Hälsokontrollen av noder misslyckas för test "dcism"

Additional Information

Framtvinga användning av ism_fix (iDRAC-omstart)

Autofix körs om "dcism" eller "dellism" inte körs när de efterfrågas från VxRM. Detta gäller dock endast om argumentet test profile eller --fix aktiverar Autofix.
Alternativt kan en iDRAC-omstart rekommenderas för att lösa andra problem och så att Autofix kan aktiveras istället för ett VxVerify-argument. 
Det här är ett säkrare sätt att återställa iDRAC-kommunikation än att starta om direkt från iDRAC-användargränssnittet, eftersom VxVerify stänger av iSM och relaterade tjänster innan iDRAC startas om, och sedan säkerhetskopierar tjänsterna i rätt ordning efteråt.
Åsidosättningsargumentet kan antingen begära att alla noder har en förskjuten iDRAC-omstart eller en lista över specifika noder.

Så här tillämpar du korrigeringen på noder (även om iSM körs normalt), vilket startar om iDRAC och relaterade tjänster:

  • Tillämpa antingen forcering av iSM- och iDRAC-omstartsproceduren ('ism_fix') på alla noder:

./vxverify.sh -a ism_fix=all​​​
  • Du kan också använda "ism_fix" för angivna noder i en lista (inga blanksteg) (antingen korta eller fullständigt kvalificerade namn fungerar):

python vxverify3.pyc <any_other_arguments> -a ism_fix=lab-08-esxi-01,lab-08-esxi-02

Exemplen ovan visar Shell- och Python-metoderna för att köra VxVerify, men argumenten fungerar med båda syntaxerna.
Argumentet -a (--additional-params) tillåter att ett obegränsat antal argumentpar anges, så det måste komma efter alla andra standardargument, till exempel --verbose

När det här argumentet används kan åsidosättningen ses i vxv.log på följande sätt:

INFO [ism_fix] Running fix for Dell ISM on node: lab-08-esxi-01, due to override argument: lab-08-esxi-01.lab.local,lab-08-esxi-02.lab.local
or 
INFO [ism_fix] Running fix for Dell ISM on node: lab-08-esxi-02, due to override argument: all 

Affected Products

VxRail, iDRAC Service Module, VxRail Appliance Family, VxRail Appliance Series, VxRail Software
Article Properties
Article Number: 000205179
Article Type: Solution
Last Modified: 18 Dec 2024
Version:  12
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.