Dell VxRail: Sundhedstjek af "ism_fix" eller "rac_fix", der retter iSM- og iDRAC-problemer
Summary: VxVerify på VxRail Manager kan forsøge at rette iDRAC- og iSM-fejl ved at genstarte iDRAC og relaterede VxRail-nodetjenester.
Symptoms
Før der køres test direkte på hver node ved hjælp af VxVerify minion, spørger VxVerify på VxRail Manager først Dell iSM (dcism eller dellism).
Hvis der blev fundet iDRAC-problemer under kørsel af helbredstjek, forsøges dette Autofix, før tilstandskontrollerne forsøges igen.
Hvis indstillingen Autofix er aktiveret (enten af testprofilen eller med argumentet --fix), tager forsøget på at rette dette ca. 10 minutter.
Resultatet af denne automatiske rettelse er angivet som et af følgende:
|
Testresultat
|
Resultatkode
|
Fortolkning af resultat
|
|
Godkendt
|
0
|
Rettelse af iSM-status var enten unødvendig eller ikke aktiveret under testprofilen.
|
|
Advarsel
|
1
|
Dell iSM-status kørte korrekt efter genstart. |
| Fiasko | 2 |
Dell iSM og iDRAC blev genstartet, men iSM kørte stadig ikke korrekt bagefter.
|
| Kritiske | 3 |
Denne test har intet kritisk resultat.
|
Hver test, der består, er ikke angivet i oversigtsrapporten for at lette læsningen.
Et eksempel på resultatet af sundhedstjekket er vist nedenfor:
#========================#======#=========#====================================================================#==============# | Hostname / Category |Status Dell_KB | Warnings or Failures, unless tests Passed ; Product S.N. | #========================#======#=========#====================================================================#==============# | _cluster | Warning 205179 | ism_fix: iSM and iDRAC fixed for node1.lab.local, node4.lab.local .| | `` | Warning 205179 | rac_fix: iSM and iDRAC fixed for node2.lab.local |Handlingen 'ism_fix' kører før håndlangerne, og rettelseskommandoerne køres eksternt fra VxRM ved hjælp af SSH. F.eks.:
Running VxVerify 3.21.108, pre-upgrade healthcheck on VxRail 7.0.372. In case of program errors consult article https://www.dell.com/support/kbdoc/000066460. Step 1: Fixing iSM issue, prior to running health-checks, on node: lab-08-esxi-01.lab.local Step 1: Fixing iSM issue, prior to running health-checks, on node: lab-08-esxi-02.lab.local Step 1: Stopping ISM and platform service on lab-08-esxi-01.lab.local Step 1: Stopping ISM and platform service on lab-08-esxi-02.lab.local Step 1: Pausing for 266 seconds more after iDRAC restarted on ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local'] ... Step 1: Starting iSM on lab-08-esxi-01.lab.local Step 1: Starting iSM on lab-08-esxi-02.lab.local Step 1: Pausing for 84 seconds more after Dell iSM started on ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local'] ... Step 1: Starting Platform service on lab-08-esxi-01.lab.local Step 1: Starting Platform service on lab-08-esxi-02.lab.localAutofixet kan også ses i vxv.log før de minion_run hændelser:
2022-11-11 09:51:26-INFO [ism_fix] Fixing phase 1 Dell ISM on node on lab-08-esxi-01.lab.local 2022-11-11 09:51:31-INFO [ism_fix] lab-08-esxi-01.lab.local Auto-fix continuing with vSAN objecthealth: green 2022-11-11 09:51:32-INFO [ism_fix] iDRAC restarting on lab-08-esxi-01.lab.local: _ ... 2022-11-11 09:58:58-INFO [ism_fix] Checking hosts for auto-fix success: ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local']
Cause
- Stop tjenester: sfcbd, dcism, PTAgent (hvis til stede) & Platform-service
- Genstart iDRAC, og vent derefter 5 minutter, indtil iDRAC er online igen
- Start tjenester (angivet ovenfor)
Resolution
iSM-status testes igen ved hjælp af "dcism"-sundhedstjekket direkte på den pågældende node. Dette kan rapportere et andet resultat, fordi dette polles et par minutter efter autofixet. Hvis resultatet er forskelligt, skal »dcism«-testen betragtes som det mest nøjagtige resultat for iSM's status.
Resultaterne af kommandoerne til at starte tjenesterne findes i vxv.log (se artikel 66460: VxVerify fejlfindingsvejledning ).
2022-11-25 09:16:26-DEBUG [ism_fix] node-04.lab.local iSM start: _ 2022-11-25 09:18:26-DEBUG [ism_fix] node-04.lab.local Platform service start: Starting Platform Service Daemon. Check hostd status. hostd is ready. Platform Service started. 2022-11-25 09:18:26-INFO [ism_fix] Checking hosts for auto-fix success: ['node-04.lab.local'] 2022-11-25 09:18:26-INFO [ism_check] Querying DC or Dell ISM status on host 2022-11-25 09:18:26-INFO [ism_check] iSM status on node-04.lab.local : iSM is active (running)
Hvis iSM ikke kan løses ved hjælp af ovenstående trin, som sundhedstjekket kan køre automatisk, så se artiklen: Dell VxRail: Nodetilstandskontrol mislykkes for test-"dcism"
Additional Information
Tving brug af ism_fix (iDRAC-genstart)
Autofixet kører, hvis 'dcism' eller 'dellism' ikke kører, når de forespørges fra VxRM. Dette gælder dog kun, hvis testprofilen eller argumentet --fix aktiverer Autofix.
Alternativt kan en iDRAC-genstart anbefales for at løse andre problemer, så Autofix kan aktiveres over et VxVerify-argument.
Dette er en sikrere måde at gendanne iDRAC-kommunikation på end en genstart direkte fra iDRAC-brugergrænsefladen, fordi VxVerify lukker iSM og relaterede tjenester ned, før iDRAC genstartes, og derefter bringer tjenester op igen i den rigtige rækkefølge bagefter.
Tilsidesættelsesargumentet kan enten anmode om, at alle noder genstartes forskudt iDRAC, eller om en liste over specifikke noder.
Sådan anvendes rettelsen på noder (selvom iSM kører normalt), som genstarter iDRAC og de relaterede tjenester:
-
Du kan enten gennemtvinge iSM- og iDRAC-genstartsproceduren ("ism_fix") på alle noder:
./vxverify.sh -a ism_fix=all
-
Eller anvend 'ism_fix' på angivne noder på en liste (ingen mellemrum) (enten korte eller fuldt kvalificerede navne fungerer):
python vxverify3.pyc <any_other_arguments> -a ism_fix=lab-08-esxi-01,lab-08-esxi-02
Eksemplerne ovenfor viser Shell- og Python-metoderne til at køre VxVerify, men argumenterne fungerer med begge syntakser.
Argumentet -a (--additional-params) gør det muligt at angive et ubegrænset antal argumentpar, så det skal komme efter alle andre standardargumenter, f.eks. --detaljeret
Når dette argument bruges, kan tilsidesættelsen ses i vxv.log som følger:
INFO [ism_fix] Running fix for Dell ISM on node: lab-08-esxi-01, due to override argument: lab-08-esxi-01.lab.local,lab-08-esxi-02.lab.local or INFO [ism_fix] Running fix for Dell ISM on node: lab-08-esxi-02, due to override argument: all