Dell VxRail: Helsesjekk "ism_fix" eller "rac_fix" for å korrigere iSM- og iDRAC-problemer
Summary: VxVerify på VxRail Manager kan forsøke å rette opp iDRAC- og iSM-feilen ved å starte iDRAC og relaterte VxRail-nodetjenester på nytt.
Symptoms
Før du kjører tester direkte på hver node ved hjelp av VxVerify-minion, spør VxVerify på VxRail Manager først Dell iSM (dcism eller dellisme).
Hvis det oppdages problemer med iDRAC ved kjøring av tilstandskontroller, forsøker denne Autofixen seg før du prøver tilstandskontrollene på nytt.
Hvis Autofix-alternativet er aktivert (enten ved testprofilen eller med argumentet --fix), tar forsøket på å korrigere dette rundt 10 minutter.
Resultatet av denne automatiske korrigeringen er oppført som ett av følgende:
|
Testresultat
|
Resultatkode
|
Resultat Tolkning
|
|
Godkjennes
|
0
|
Korrigering av iSM-status var enten unødvendig eller ikke aktivert under testprofilen.
|
|
Advarsel
|
1
|
Dell iSM-statusen ble kjørt på riktig måte etter omstart. |
| Fiasko | 2 |
Dell iSM og iDRAC ble startet på nytt, men iSM kjørte fortsatt ikke riktig etterpå.
|
| Kritisk | 3 |
Denne testen har ingen kritiske resultater.
|
Hver test som består er ikke oppført i sammendragsrapporten, for enkel lesing.
Et eksempel på helsesjekkresultatet er vist nedenfor:
#========================#======#=========#====================================================================#==============# | Hostname / Category |Status Dell_KB | Warnings or Failures, unless tests Passed ; Product S.N. | #========================#======#=========#====================================================================#==============# | _cluster | Warning 205179 | ism_fix: iSM and iDRAC fixed for node1.lab.local, node4.lab.local .| | `` | Warning 205179 | rac_fix: iSM and iDRAC fixed for node2.lab.local |'ism_fix'-operasjonen kjører før minions, og reparasjonskommandoene kjøres eksternt fra VxRM ved hjelp av SSH. Eksempel:
Running VxVerify 3.21.108, pre-upgrade healthcheck on VxRail 7.0.372. In case of program errors consult article https://www.dell.com/support/kbdoc/000066460. Step 1: Fixing iSM issue, prior to running health-checks, on node: lab-08-esxi-01.lab.local Step 1: Fixing iSM issue, prior to running health-checks, on node: lab-08-esxi-02.lab.local Step 1: Stopping ISM and platform service on lab-08-esxi-01.lab.local Step 1: Stopping ISM and platform service on lab-08-esxi-02.lab.local Step 1: Pausing for 266 seconds more after iDRAC restarted on ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local'] ... Step 1: Starting iSM on lab-08-esxi-01.lab.local Step 1: Starting iSM on lab-08-esxi-02.lab.local Step 1: Pausing for 84 seconds more after Dell iSM started on ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local'] ... Step 1: Starting Platform service on lab-08-esxi-01.lab.local Step 1: Starting Platform service on lab-08-esxi-02.lab.localAutofiksen kan også sees i vxv.log før de minion_run hendelsene:
2022-11-11 09:51:26-INFO [ism_fix] Fixing phase 1 Dell ISM on node on lab-08-esxi-01.lab.local 2022-11-11 09:51:31-INFO [ism_fix] lab-08-esxi-01.lab.local Auto-fix continuing with vSAN objecthealth: green 2022-11-11 09:51:32-INFO [ism_fix] iDRAC restarting on lab-08-esxi-01.lab.local: _ ... 2022-11-11 09:58:58-INFO [ism_fix] Checking hosts for auto-fix success: ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local']
Cause
- Stopp tjenester: sfcbd, dcism, PTAgent (hvis det finnes) og plattformtjeneste
- Start iDRAC på nytt, og vent deretter i fem minutter før iDRAC er tilkoblet igjen
- Start tjenester (oppført ovenfor)
Resolution
iSM-statusen testes på nytt ved hjelp av «dcism»-helsesjekken direkte på den noden. Dette kan rapportere et annet resultat, fordi dette spørres noen minutter etter Autofix. Hvis resultatet er forskjellig, bør "dcism" -testen sees på som det mer nøyaktige resultatet for statusen til iSM.
Resultatene av kommandoene for å starte tjenestene finner du i vxv.log (se artikkel 66460: VxVerify feilsøkingsveiledning ).
2022-11-25 09:16:26-DEBUG [ism_fix] node-04.lab.local iSM start: _ 2022-11-25 09:18:26-DEBUG [ism_fix] node-04.lab.local Platform service start: Starting Platform Service Daemon. Check hostd status. hostd is ready. Platform Service started. 2022-11-25 09:18:26-INFO [ism_fix] Checking hosts for auto-fix success: ['node-04.lab.local'] 2022-11-25 09:18:26-INFO [ism_check] Querying DC or Dell ISM status on host 2022-11-25 09:18:26-INFO [ism_check] iSM status on node-04.lab.local : iSM is active (running)
Hvis iSM ikke kan løses av trinnene ovenfor, som helsesjekken kan kjøre automatisk, kan du se artikkel: Dell VxRail: Node health-check mislykkes for test 'dcism'
Additional Information
Tving bruk av ism_fix (omstart av iDRAC)
Autofiksen kjører hvis "dcism" eller "dellism" ikke kjører når de spørres fra VxRM. Dette gjelder imidlertid bare hvis testprofil- eller --fix-argumentet aktiverer Autofix.
Det kan også anbefales en omstart av iDRAC for å løse andre problemer, slik at Autofix kan aktiveres over et VxVerify-argument.
Dette er en sikrere måte å gjenopprette iDRAC-kommunikasjon på enn å starte på nytt direkte fra iDRAC-brukergrensesnittet, fordi VxVerify avslutter iSM og relaterte tjenester før iDRAC startes på nytt, og deretter henter tjenestene opp igjen i riktig rekkefølge etterpå.
Overstyringsargumentet kan enten be om at alle noder har en forskjøvet iDRAC-omstart, eller om en liste over bestemte noder.
Slik bruker du hurtigreparasjonen på noder (selv om iSM kjører normalt), som starter iDRAC og relaterte tjenester på nytt:
-
Bruk enten iSM- og iDRAC-omstartprosedyren ('ism_fix') på alle noder:
./vxverify.sh -a ism_fix=all
-
Eller bruk "ism_fix" på spesifiserte noder i en liste (ingen mellomrom) (enten korte eller fullt kvalifiserte navn vil fungere):
python vxverify3.pyc <any_other_arguments> -a ism_fix=lab-08-esxi-01,lab-08-esxi-02
Eksemplene ovenfor viser Shell- og Python-metodene for å kjøre VxVerify, men argumentene fungerer med begge syntaksene.
-a-argumentet (--additional-params), tillater at et ubegrenset antall argumentpar spesifiseres, så det må komme etter alle andre standardargumenter, for eksempel --verbose
Når dette argumentet brukes, kan overstyringen sees i vxv.log som følger:
INFO [ism_fix] Running fix for Dell ISM on node: lab-08-esxi-01, due to override argument: lab-08-esxi-01.lab.local,lab-08-esxi-02.lab.local or INFO [ism_fix] Running fix for Dell ISM on node: lab-08-esxi-02, due to override argument: all