Dell VxRail: hälsokontroll "ism_fix" eller "rac_fix" som korrigerar iSM- och iDRAC-problem
Summary: Med VxVerify på VxRail Manager kan du försöka korrigera iDRAC- och iSM-fel genom att starta om iDRAC och relaterade VxRail-nodtjänster.
Symptoms
Innan tester körs direkt på varje nod frågar VxVerify på VxRail Manager först Dell iSM (dcism eller dellism) med hjälp av VxVerify-minion.
Alternativt, om iDRAC-problem påträffades när hälsokontroller kördes, görs ett försök med denna Autofix innan ett nytt försök görs med hälsokontrollerna.
Om alternativet Autofix är aktiverat (antingen av testprofilen eller med argumentet --fix) tar det cirka 10 minuter att korrigera detta.
Resultatet av den här automatiska korrigeringen visas som något av följande:
|
Testresultat
|
Resultatkod
|
Tolkning av resultat
|
|
Lyckas
|
0
|
Korrigering av iSM-status var antingen onödig eller aktiverad inte under testprofilen.
|
|
Varning
|
1
|
Dell iSM-status kördes korrekt efter omstart. |
| Misslyckande | 2 |
Dell iSM och iDRAC startades om, men iSM kördes fortfarande inte korrekt efteråt.
|
| Kritisk | 3 |
Det här testet har inget kritiskt resultat.
|
Alla tester som godkänns visas inte i den sammanfattande rapporten för att underlätta läsningen.
Ett exempel på hälsokontrollens utdata visas nedan:
#========================#======#=========#====================================================================#==============# | Hostname / Category |Status Dell_KB | Warnings or Failures, unless tests Passed ; Product S.N. | #========================#======#=========#====================================================================#==============# | _cluster | Warning 205179 | ism_fix: iSM and iDRAC fixed for node1.lab.local, node4.lab.local .| | `` | Warning 205179 | rac_fix: iSM and iDRAC fixed for node2.lab.local |ism_fix-åtgärden körs före minionerna och korrigeringskommandona fjärrkörs från VxRM med SSH. Till exempel:
Running VxVerify 3.21.108, pre-upgrade healthcheck on VxRail 7.0.372. In case of program errors consult article https://www.dell.com/support/kbdoc/000066460. Step 1: Fixing iSM issue, prior to running health-checks, on node: lab-08-esxi-01.lab.local Step 1: Fixing iSM issue, prior to running health-checks, on node: lab-08-esxi-02.lab.local Step 1: Stopping ISM and platform service on lab-08-esxi-01.lab.local Step 1: Stopping ISM and platform service on lab-08-esxi-02.lab.local Step 1: Pausing for 266 seconds more after iDRAC restarted on ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local'] ... Step 1: Starting iSM on lab-08-esxi-01.lab.local Step 1: Starting iSM on lab-08-esxi-02.lab.local Step 1: Pausing for 84 seconds more after Dell iSM started on ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local'] ... Step 1: Starting Platform service on lab-08-esxi-01.lab.local Step 1: Starting Platform service on lab-08-esxi-02.lab.localAutorättningen kan också ses i vxv.log före händelserna i minion_run:
2022-11-11 09:51:26-INFO [ism_fix] Fixing phase 1 Dell ISM on node on lab-08-esxi-01.lab.local 2022-11-11 09:51:31-INFO [ism_fix] lab-08-esxi-01.lab.local Auto-fix continuing with vSAN objecthealth: green 2022-11-11 09:51:32-INFO [ism_fix] iDRAC restarting on lab-08-esxi-01.lab.local: _ ... 2022-11-11 09:58:58-INFO [ism_fix] Checking hosts for auto-fix success: ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local']
Cause
- Stopptjänster: sfcbd, dcism, PTAgent (om sådan finns) och plattformstjänst
- Starta om iDRAC och vänta sedan i 5 minuter tills iDRAC är online igen
- Starta tjänster (anges ovan)
Resolution
iSM-statusen testas på nytt med hjälp av dcism-hälsokontrollen direkt på noden. Detta kan rapportera ett annat resultat, eftersom detta avsöks några minuter efter autokorrigeringen. Om resultatet skiljer sig åt bör "dcism"-testet ses som det mer exakta resultatet för statusen för iSM.
Resultatet av kommandona för att starta tjänsterna finns i vxv.log (se artikel 66460: Felsökningsmanual för VxVerify ).
2022-11-25 09:16:26-DEBUG [ism_fix] node-04.lab.local iSM start: _ 2022-11-25 09:18:26-DEBUG [ism_fix] node-04.lab.local Platform service start: Starting Platform Service Daemon. Check hostd status. hostd is ready. Platform Service started. 2022-11-25 09:18:26-INFO [ism_fix] Checking hosts for auto-fix success: ['node-04.lab.local'] 2022-11-25 09:18:26-INFO [ism_check] Querying DC or Dell ISM status on host 2022-11-25 09:18:26-INFO [ism_check] iSM status on node-04.lab.local : iSM is active (running)
Om iSM inte kan åtgärdas med stegen ovan, som hälsokontrollen kan köra automatiskt, läser du artikeln: Dell VxRail: Hälsokontrollen av noder misslyckas för test "dcism"
Additional Information
Framtvinga användning av ism_fix (iDRAC-omstart)
Autofix körs om "dcism" eller "dellism" inte körs när de efterfrågas från VxRM. Detta gäller dock endast om argumentet test profile eller --fix aktiverar Autofix.
Alternativt kan en iDRAC-omstart rekommenderas för att lösa andra problem och så att Autofix kan aktiveras istället för ett VxVerify-argument.
Det här är ett säkrare sätt att återställa iDRAC-kommunikation än att starta om direkt från iDRAC-användargränssnittet, eftersom VxVerify stänger av iSM och relaterade tjänster innan iDRAC startas om, och sedan säkerhetskopierar tjänsterna i rätt ordning efteråt.
Åsidosättningsargumentet kan antingen begära att alla noder har en förskjuten iDRAC-omstart eller en lista över specifika noder.
Så här tillämpar du korrigeringen på noder (även om iSM körs normalt), vilket startar om iDRAC och relaterade tjänster:
-
Tillämpa antingen forcering av iSM- och iDRAC-omstartsproceduren ('ism_fix') på alla noder:
./vxverify.sh -a ism_fix=all
-
Du kan också använda "ism_fix" för angivna noder i en lista (inga blanksteg) (antingen korta eller fullständigt kvalificerade namn fungerar):
python vxverify3.pyc <any_other_arguments> -a ism_fix=lab-08-esxi-01,lab-08-esxi-02
Exemplen ovan visar Shell- och Python-metoderna för att köra VxVerify, men argumenten fungerar med båda syntaxerna.
Argumentet -a (--additional-params) tillåter att ett obegränsat antal argumentpar anges, så det måste komma efter alla andra standardargument, till exempel --verbose
När det här argumentet används kan åsidosättningen ses i vxv.log på följande sätt:
INFO [ism_fix] Running fix for Dell ISM on node: lab-08-esxi-01, due to override argument: lab-08-esxi-01.lab.local,lab-08-esxi-02.lab.local or INFO [ism_fix] Running fix for Dell ISM on node: lab-08-esxi-02, due to override argument: all