Dell VxRail: healthcheck 'ism_fix' of 'rac_fix' om iSM- en iDRAC-problemen op te lossen
Summary: VxVerify op VxRail Manager kan proberen de iDRAC- en iSM-fout te corrigeren door iDRAC en gerelateerde VxRail-knooppuntservices opnieuw te starten.
Symptoms
Voordat tests rechtstreeks op elk knooppunt worden uitgevoerd, met behulp van VxVerify minion, voert VxVerify op VxRail Manager eerst een query uit op de Dell iSM (dcism of dellism).
Als er ook iDRAC-problemen zijn aangetroffen bij het uitvoeren van healthchecks, wordt dit autofix geprobeerd voordat de healthchecks opnieuw worden uitgevoerd.
Als de optie Autofix is ingeschakeld (door het testprofiel of met argument --fix), duurt het ongeveer 10 minuten om dit te corrigeren.
Het resultaat van deze autocorrectie wordt vermeld als een van de volgende:
|
Testresultaat
|
Resultaatcode
|
Interpretatie van het resultaat
|
|
Geslaagd
|
0
|
Het corrigeren van de iSM-status was niet nodig of niet ingeschakeld in het testprofiel.
|
|
Warning
|
1
|
De Dell iSM-status werd correct uitgevoerd na het opnieuw opstarten. |
| Mislukking | 2 |
Dell iSM en iDRAC werden opnieuw gestart, maar iSM werkte daarna nog steeds niet correct.
|
| Kritiek | 3 |
Deze test heeft geen kritisch resultaat.
|
Elke test die slaagt, wordt voor het gemak niet vermeld in het samenvattende rapport.
Hieronder ziet u een voorbeeld van de uitvoer van de statuscontrole:
#========================#======#=========#====================================================================#==============# | Hostname / Category |Status Dell_KB | Warnings or Failures, unless tests Passed ; Product S.N. | #========================#======#=========#====================================================================#==============# | _cluster | Warning 205179 | ism_fix: iSM and iDRAC fixed for node1.lab.local, node4.lab.local .| | `` | Warning 205179 | rac_fix: iSM and iDRAC fixed for node2.lab.local |De 'ism_fix'-bewerking wordt uitgevoerd vóór de minions en de reparatieopdrachten worden op afstand uitgevoerd vanuit VxRM met behulp van SSH. Bijvoorbeeld:
Running VxVerify 3.21.108, pre-upgrade healthcheck on VxRail 7.0.372. In case of program errors consult article https://www.dell.com/support/kbdoc/000066460. Step 1: Fixing iSM issue, prior to running health-checks, on node: lab-08-esxi-01.lab.local Step 1: Fixing iSM issue, prior to running health-checks, on node: lab-08-esxi-02.lab.local Step 1: Stopping ISM and platform service on lab-08-esxi-01.lab.local Step 1: Stopping ISM and platform service on lab-08-esxi-02.lab.local Step 1: Pausing for 266 seconds more after iDRAC restarted on ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local'] ... Step 1: Starting iSM on lab-08-esxi-01.lab.local Step 1: Starting iSM on lab-08-esxi-02.lab.local Step 1: Pausing for 84 seconds more after Dell iSM started on ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local'] ... Step 1: Starting Platform service on lab-08-esxi-01.lab.local Step 1: Starting Platform service on lab-08-esxi-02.lab.localDe Autofix is ook te zien in de vxv.log voorafgaand aan de minion_run gebeurtenissen:
2022-11-11 09:51:26-INFO [ism_fix] Fixing phase 1 Dell ISM on node on lab-08-esxi-01.lab.local 2022-11-11 09:51:31-INFO [ism_fix] lab-08-esxi-01.lab.local Auto-fix continuing with vSAN objecthealth: green 2022-11-11 09:51:32-INFO [ism_fix] iDRAC restarting on lab-08-esxi-01.lab.local: _ ... 2022-11-11 09:58:58-INFO [ism_fix] Checking hosts for auto-fix success: ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local']
Cause
- Stop services: sfcbd, dcism, PTAgent (indien aanwezig) en Platform-service
- Start iDRAC opnieuw en wacht 5 minuten totdat iDRAC weer online is
- Services starten (hierboven vermeld)
Resolution
De iSM-status wordt opnieuw getest met behulp van de 'dcism'-statuscontrole rechtstreeks op dat knooppunt. Dit kan een ander resultaat opleveren, omdat dit een paar minuten na de Autofix wordt gepollt. Als het resultaat afwijkt, moet de 'dcism'-test worden gezien als het nauwkeurigere resultaat voor de status van iSM.
De resultaten van de opdrachten om de diensten te starten zijn te vinden in de vxv.log (zie artikel 66460: VxVerify-probleemoplossingsgids ).
2022-11-25 09:16:26-DEBUG [ism_fix] node-04.lab.local iSM start: _ 2022-11-25 09:18:26-DEBUG [ism_fix] node-04.lab.local Platform service start: Starting Platform Service Daemon. Check hostd status. hostd is ready. Platform Service started. 2022-11-25 09:18:26-INFO [ism_fix] Checking hosts for auto-fix success: ['node-04.lab.local'] 2022-11-25 09:18:26-INFO [ism_check] Querying DC or Dell ISM status on host 2022-11-25 09:18:26-INFO [ism_check] iSM status on node-04.lab.local : iSM is active (running)
Als iSM niet kan worden opgelost door de bovenstaande stappen, die automatisch kunnen worden uitgevoerd door de healthcheck, raadpleeg dan het artikel: Dell VxRail: Statuscontrole van knooppunt mislukt voor test DCISM
Additional Information
Geforceerd gebruik van ism_fix (iDRAC opnieuw opstarten)
De Autofix wordt uitgevoerd als 'dcism' of 'dellism' niet worden uitgevoerd wanneer er een query op wordt uitgevoerd vanuit VxRM. Dit is echter alleen van toepassing als het testprofiel of het argument --fix de Autofix mogelijk maakt.
Ook kan iDRAC opnieuw opstarten worden aanbevolen om andere problemen op te lossen, zodat Autofix kan worden ingeschakeld via een VxVerify-argument.
Dit is een veiligere manier om iDRAC-communicatie te herstellen dan rechtstreeks opnieuw op te starten vanuit de iDRAC-gebruikersinterface, omdat VxVerify de iSM en gerelateerde services afsluit voordat iDRAC opnieuw wordt gestart en daarna de services weer
in de juiste volgorde opstart.Met het override-argument kan worden gevraagd om alle knooppunten gespreid opnieuw op te starten, of om een lijst met specifieke knooppunten.
De oplossing toepassen op knooppunten (zelfs als iSM normaal wordt uitgevoerd), waardoor iDRAC en de gerelateerde services opnieuw worden gestart:
-
Of pas de iSM- en iDRAC-herstartprocedure ('ism_fix') geforceerd toe op alle knooppunten:
./vxverify.sh -a ism_fix=all
-
Of pas 'ism_fix' toe op opgegeven knooppunten in een lijst (geen spaties) (korte of volledig gekwalificeerde namen werken):
python vxverify3.pyc <any_other_arguments> -a ism_fix=lab-08-esxi-01,lab-08-esxi-02
Bovenstaande voorbeelden tonen de Shell- en Python-methoden voor het uitvoeren van VxVerify, maar de argumenten werken met beide syntaxis.
Het argument -a (--additional-params), maakt het mogelijk om een onbeperkt aantal argumentparen op te geven, dus het moet na alle andere standaardargumenten komen, zoals --verbose
Wanneer dit argument wordt gebruikt, kan de overschrijving als volgt in de vxv.log worden weergegeven:
INFO [ism_fix] Running fix for Dell ISM on node: lab-08-esxi-01, due to override argument: lab-08-esxi-01.lab.local,lab-08-esxi-02.lab.local or INFO [ism_fix] Running fix for Dell ISM on node: lab-08-esxi-02, due to override argument: all