Dell VxRail: Sundhedstjek af "ism_fix" eller "rac_fix", der retter iSM- og iDRAC-problemer

Summary: VxVerify på VxRail Manager kan forsøge at rette iDRAC- og iSM-fejl ved at genstarte iDRAC og relaterede VxRail-nodetjenester.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

VxVerify på VxRail Manager kan forsøge at rette iDRAC- og iSM-fejl ved at genstarte iDRAC og relaterede VxRail-nodetjenester.
Før der køres test direkte på hver node ved hjælp af VxVerify minion, spørger VxVerify på VxRail Manager først Dell iSM (dcism eller dellism).
Hvis der blev fundet iDRAC-problemer under kørsel af helbredstjek, forsøges dette Autofix, før tilstandskontrollerne forsøges igen.
Hvis indstillingen Autofix er aktiveret (enten af testprofilen eller med argumentet --fix), tager forsøget på at rette dette ca. 10 minutter.

Resultatet af denne automatiske rettelse er angivet som et af følgende:
Testresultat
Resultatkode
    Fortolkning af resultat
Godkendt
0
Rettelse af iSM-status var enten unødvendig eller ikke aktiveret under testprofilen.
Advarsel
1
Dell iSM-status kørte korrekt efter genstart.
Fiasko 2
Dell iSM og iDRAC blev genstartet, men iSM kørte stadig ikke korrekt bagefter.
Kritiske 3
Denne test har intet kritisk resultat.
Denne rettelse kan også udløses, når VxVerify-kontrollerne er kørt, hvis iDRAC-forespørgsler mislykkes. I så fald køres VxVerify minion for anden gang efter rettelsen. De gentagne tests kontrollerer, om iSM- og iDRAC-problemer er løst.
Hver test, der består, er ikke angivet i oversigtsrapporten for at lette læsningen.
Et eksempel på resultatet af sundhedstjekket er vist nedenfor:
#========================#======#=========#====================================================================#==============#
|  Hostname / Category   |Status  Dell_KB |  Warnings or Failures, unless tests Passed                         ; Product S.N. |
#========================#======#=========#====================================================================#==============#
| _cluster               | Warning 205179 | ism_fix: iSM and iDRAC fixed for node1.lab.local, node4.lab.local                .|
|   ``                   | Warning 205179 | rac_fix: iSM and iDRAC fixed for node2.lab.local                                  |

Handlingen 'ism_fix' kører før håndlangerne, og rettelseskommandoerne køres eksternt fra VxRM ved hjælp af SSH. F.eks.:
Running VxVerify 3.21.108, pre-upgrade healthcheck on VxRail 7.0.372.
In case of program errors consult article https://www.dell.com/support/kbdoc/000066460.
Step 1: Fixing iSM issue, prior to running health-checks, on node: lab-08-esxi-01.lab.local
Step 1: Fixing iSM issue, prior to running health-checks, on node: lab-08-esxi-02.lab.local
Step 1: Stopping ISM and platform service on lab-08-esxi-01.lab.local
Step 1: Stopping ISM and platform service on lab-08-esxi-02.lab.local
Step 1: Pausing for 266 seconds more after iDRAC restarted on ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local'] 
... 
Step 1: Starting iSM on lab-08-esxi-01.lab.local
Step 1: Starting iSM on lab-08-esxi-02.lab.local
Step 1: Pausing for 84 seconds more after Dell iSM started on ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local']
...
Step 1: Starting Platform service on lab-08-esxi-01.lab.local
Step 1: Starting Platform service on lab-08-esxi-02.lab.local
Autofixet kan også ses i vxv.log før de minion_run hændelser:
2022-11-11 09:51:26-INFO     [ism_fix] Fixing phase 1 Dell ISM on node on lab-08-esxi-01.lab.local
2022-11-11 09:51:31-INFO     [ism_fix] lab-08-esxi-01.lab.local Auto-fix continuing with vSAN objecthealth: green
2022-11-11 09:51:32-INFO     [ism_fix] iDRAC restarting on lab-08-esxi-01.lab.local: _
...
2022-11-11 09:58:58-INFO     [ism_fix] Checking hosts for auto-fix success: ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local']

Cause

For at rette op på, at dcism ikke kører, udfører VxVerify følgende trin, hvis denne funktion til automatisk afhjælpning er aktiveret i testprofilen:
  • Stop tjenester: sfcbd, dcism, PTAgent (hvis til stede) & Platform-service
  • Genstart iDRAC, og vent derefter 5 minutter, indtil iDRAC er online igen
  • Start tjenester (angivet ovenfor)

Resolution

Autofixet til iSM rapporterer dets succes eller fiasko afhængigt af status for "dcism" eller "dellism", når det bliver spurgt eksternt af VxVerify. Minions startes derefter som normalt.
iSM-status testes igen ved hjælp af "dcism"-sundhedstjekket direkte på den pågældende node. Dette kan rapportere et andet resultat, fordi dette polles et par minutter efter autofixet. Hvis resultatet er forskelligt, skal »dcism«-testen betragtes som det mest nøjagtige resultat for iSM's status.

Resultaterne af kommandoerne til at starte tjenesterne findes i vxv.log (se artikel 66460: VxVerify fejlfindingsvejledning ).
2022-11-25 09:16:26-DEBUG    [ism_fix] node-04.lab.local iSM start: _
2022-11-25 09:18:26-DEBUG    [ism_fix] node-04.lab.local Platform service start: Starting Platform Service Daemon. Check hostd status. hostd is ready. Platform Service started.
2022-11-25 09:18:26-INFO     [ism_fix] Checking hosts for auto-fix success: ['node-04.lab.local']
2022-11-25 09:18:26-INFO     [ism_check] Querying DC or Dell ISM status on host
2022-11-25 09:18:26-INFO     [ism_check] iSM status on node-04.lab.local : iSM is active (running)

Hvis iSM ikke kan løses ved hjælp af ovenstående trin, som sundhedstjekket kan køre automatisk, så se artiklen: Dell VxRail: Nodetilstandskontrol mislykkes for test-"dcism"

Additional Information

Tving brug af ism_fix (iDRAC-genstart)

Autofixet kører, hvis 'dcism' eller 'dellism' ikke kører, når de forespørges fra VxRM. Dette gælder dog kun, hvis testprofilen eller argumentet --fix aktiverer Autofix.
Alternativt kan en iDRAC-genstart anbefales for at løse andre problemer, så Autofix kan aktiveres over et VxVerify-argument. 
Dette er en sikrere måde at gendanne iDRAC-kommunikation på end en genstart direkte fra iDRAC-brugergrænsefladen, fordi VxVerify lukker iSM og relaterede tjenester ned, før iDRAC genstartes, og derefter bringer tjenester op igen i den rigtige rækkefølge bagefter.
Tilsidesættelsesargumentet kan enten anmode om, at alle noder genstartes forskudt iDRAC, eller om en liste over specifikke noder.

Sådan anvendes rettelsen på noder (selvom iSM kører normalt), som genstarter iDRAC og de relaterede tjenester:

  • Du kan enten gennemtvinge iSM- og iDRAC-genstartsproceduren ("ism_fix") på alle noder:

./vxverify.sh -a ism_fix=all​​​
  • Eller anvend 'ism_fix' på angivne noder på en liste (ingen mellemrum) (enten korte eller fuldt kvalificerede navne fungerer):

python vxverify3.pyc <any_other_arguments> -a ism_fix=lab-08-esxi-01,lab-08-esxi-02

Eksemplerne ovenfor viser Shell- og Python-metoderne til at køre VxVerify, men argumenterne fungerer med begge syntakser.
Argumentet -a (--additional-params) gør det muligt at angive et ubegrænset antal argumentpar, så det skal komme efter alle andre standardargumenter, f.eks. --detaljeret

Når dette argument bruges, kan tilsidesættelsen ses i vxv.log som følger:

INFO [ism_fix] Running fix for Dell ISM on node: lab-08-esxi-01, due to override argument: lab-08-esxi-01.lab.local,lab-08-esxi-02.lab.local
or 
INFO [ism_fix] Running fix for Dell ISM on node: lab-08-esxi-02, due to override argument: all 

Affected Products

VxRail, iDRAC Service Module, VxRail Appliance Family, VxRail Appliance Series, VxRail Software
Article Properties
Article Number: 000205179
Article Type: Solution
Last Modified: 18 Dec 2024
Version:  12
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.