Dell VxRail: Helsesjekk "ism_fix" eller "rac_fix" for å korrigere iSM- og iDRAC-problemer

Summary: VxVerify på VxRail Manager kan forsøke å rette opp iDRAC- og iSM-feilen ved å starte iDRAC og relaterte VxRail-nodetjenester på nytt.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

VxVerify på VxRail Manager kan forsøke å rette opp iDRAC- og iSM-feilen ved å starte iDRAC og relaterte VxRail-nodetjenester på nytt.
Før du kjører tester direkte på hver node ved hjelp av VxVerify-minion, spør VxVerify på VxRail Manager først Dell iSM (dcism eller dellisme).
Hvis det oppdages problemer med iDRAC ved kjøring av tilstandskontroller, forsøker denne Autofixen seg før du prøver tilstandskontrollene på nytt.
Hvis Autofix-alternativet er aktivert (enten ved testprofilen eller med argumentet --fix), tar forsøket på å korrigere dette rundt 10 minutter.

Resultatet av denne automatiske korrigeringen er oppført som ett av følgende:
Testresultat
Resultatkode
    Resultat Tolkning
Godkjennes
0
Korrigering av iSM-status var enten unødvendig eller ikke aktivert under testprofilen.
Advarsel
1
Dell iSM-statusen ble kjørt på riktig måte etter omstart.
Fiasko 2
Dell iSM og iDRAC ble startet på nytt, men iSM kjørte fortsatt ikke riktig etterpå.
Kritisk 3
Denne testen har ingen kritiske resultater.
Denne reparasjonen kan også utløses etter at VxVerify-kontrollene er kjørt, hvis iDRAC-spørringer mislykkes. I så fall vil VxVerify-minion kjøres for andre gang etter reparasjonen. De gjentatte testene kontrollerer om iSM- og iDRAC-problemer er løst.
Hver test som består er ikke oppført i sammendragsrapporten, for enkel lesing.
Et eksempel på helsesjekkresultatet er vist nedenfor:
#========================#======#=========#====================================================================#==============#
|  Hostname / Category   |Status  Dell_KB |  Warnings or Failures, unless tests Passed                         ; Product S.N. |
#========================#======#=========#====================================================================#==============#
| _cluster               | Warning 205179 | ism_fix: iSM and iDRAC fixed for node1.lab.local, node4.lab.local                .|
|   ``                   | Warning 205179 | rac_fix: iSM and iDRAC fixed for node2.lab.local                                  |

'ism_fix'-operasjonen kjører før minions, og reparasjonskommandoene kjøres eksternt fra VxRM ved hjelp av SSH. Eksempel:
Running VxVerify 3.21.108, pre-upgrade healthcheck on VxRail 7.0.372.
In case of program errors consult article https://www.dell.com/support/kbdoc/000066460.
Step 1: Fixing iSM issue, prior to running health-checks, on node: lab-08-esxi-01.lab.local
Step 1: Fixing iSM issue, prior to running health-checks, on node: lab-08-esxi-02.lab.local
Step 1: Stopping ISM and platform service on lab-08-esxi-01.lab.local
Step 1: Stopping ISM and platform service on lab-08-esxi-02.lab.local
Step 1: Pausing for 266 seconds more after iDRAC restarted on ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local'] 
... 
Step 1: Starting iSM on lab-08-esxi-01.lab.local
Step 1: Starting iSM on lab-08-esxi-02.lab.local
Step 1: Pausing for 84 seconds more after Dell iSM started on ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local']
...
Step 1: Starting Platform service on lab-08-esxi-01.lab.local
Step 1: Starting Platform service on lab-08-esxi-02.lab.local
Autofiksen kan også sees i vxv.log før de minion_run hendelsene:
2022-11-11 09:51:26-INFO     [ism_fix] Fixing phase 1 Dell ISM on node on lab-08-esxi-01.lab.local
2022-11-11 09:51:31-INFO     [ism_fix] lab-08-esxi-01.lab.local Auto-fix continuing with vSAN objecthealth: green
2022-11-11 09:51:32-INFO     [ism_fix] iDRAC restarting on lab-08-esxi-01.lab.local: _
...
2022-11-11 09:58:58-INFO     [ism_fix] Checking hosts for auto-fix success: ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local']

Cause

For å korrigere at dcism ikke kjører, utfører VxVerify følgende trinn, hvis denne funksjonen for automatisk utbedring er aktivert i testprofilen:
  • Stopp tjenester: sfcbd, dcism, PTAgent (hvis det finnes) og plattformtjeneste
  • Start iDRAC på nytt, og vent deretter i fem minutter før iDRAC er tilkoblet igjen
  • Start tjenester (oppført ovenfor)

Resolution

Autofix for iSM rapporterer om suksess eller fiasko avhengig av statusen dcism eller dellism når den blir spurt eksternt av VxVerify. Lakeiene blir da startet som normalt.
iSM-statusen testes på nytt ved hjelp av «dcism»-helsesjekken direkte på den noden. Dette kan rapportere et annet resultat, fordi dette spørres noen minutter etter Autofix. Hvis resultatet er forskjellig, bør "dcism" -testen sees på som det mer nøyaktige resultatet for statusen til iSM.

Resultatene av kommandoene for å starte tjenestene finner du i vxv.log (se artikkel 66460: VxVerify feilsøkingsveiledning ).
2022-11-25 09:16:26-DEBUG    [ism_fix] node-04.lab.local iSM start: _
2022-11-25 09:18:26-DEBUG    [ism_fix] node-04.lab.local Platform service start: Starting Platform Service Daemon. Check hostd status. hostd is ready. Platform Service started.
2022-11-25 09:18:26-INFO     [ism_fix] Checking hosts for auto-fix success: ['node-04.lab.local']
2022-11-25 09:18:26-INFO     [ism_check] Querying DC or Dell ISM status on host
2022-11-25 09:18:26-INFO     [ism_check] iSM status on node-04.lab.local : iSM is active (running)

Hvis iSM ikke kan løses av trinnene ovenfor, som helsesjekken kan kjøre automatisk, kan du se artikkel: Dell VxRail: Node health-check mislykkes for test 'dcism'

Additional Information

Tving bruk av ism_fix (omstart av iDRAC)

Autofiksen kjører hvis "dcism" eller "dellism" ikke kjører når de spørres fra VxRM. Dette gjelder imidlertid bare hvis testprofil- eller --fix-argumentet aktiverer Autofix.
Det kan også anbefales en omstart av iDRAC for å løse andre problemer, slik at Autofix kan aktiveres over et VxVerify-argument. 
Dette er en sikrere måte å gjenopprette iDRAC-kommunikasjon på enn å starte på nytt direkte fra iDRAC-brukergrensesnittet, fordi VxVerify avslutter iSM og relaterte tjenester før iDRAC startes på nytt, og deretter henter tjenestene opp igjen i riktig rekkefølge etterpå.
Overstyringsargumentet kan enten be om at alle noder har en forskjøvet iDRAC-omstart, eller om en liste over bestemte noder.

Slik bruker du hurtigreparasjonen på noder (selv om iSM kjører normalt), som starter iDRAC og relaterte tjenester på nytt:

  • Bruk enten iSM- og iDRAC-omstartprosedyren ('ism_fix') på alle noder:

./vxverify.sh -a ism_fix=all​​​
  • Eller bruk "ism_fix" på spesifiserte noder i en liste (ingen mellomrom) (enten korte eller fullt kvalifiserte navn vil fungere):

python vxverify3.pyc <any_other_arguments> -a ism_fix=lab-08-esxi-01,lab-08-esxi-02

Eksemplene ovenfor viser Shell- og Python-metodene for å kjøre VxVerify, men argumentene fungerer med begge syntaksene.
-a-argumentet (--additional-params), tillater at et ubegrenset antall argumentpar spesifiseres, så det må komme etter alle andre standardargumenter, for eksempel --verbose

Når dette argumentet brukes, kan overstyringen sees i vxv.log som følger:

INFO [ism_fix] Running fix for Dell ISM on node: lab-08-esxi-01, due to override argument: lab-08-esxi-01.lab.local,lab-08-esxi-02.lab.local
or 
INFO [ism_fix] Running fix for Dell ISM on node: lab-08-esxi-02, due to override argument: all 

Affected Products

VxRail, iDRAC Service Module, VxRail Appliance Family, VxRail Appliance Series, VxRail Software
Article Properties
Article Number: 000205179
Article Type: Solution
Last Modified: 18 Dec 2024
Version:  12
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.