Dell VxRail: controllo integrità "ism_fix" o "rac_fix" per la correzione dei problemi di iSM e iDRAC
Summary: VxVerify su VxRail Manager può tentare di correggere gli errori di iDRAC e iSM riavviando iDRAC e i relativi servizi dei nodi VxRail.
Symptoms
Prima di eseguire i test direttamente su ciascun nodo, utilizzando il minion VxVerify, VxVerify su VxRail Manager esegue una query sull'iSM Dell (dcism o dellism).
In alternativa, se sono stati rilevati problemi di iDRAC durante l'esecuzione dei controlli integrità, viene tentata questa correzione automatica prima di ritentare i controlli integrità.
Se l'opzione Autofix è abilitata (dal profilo di test o con l'argomento --fix), il tentativo di correggere questa condizione richiede circa 10 minuti.
Il risultato di questa correzione automatica è elencato come uno dei seguenti:
|
Risultato del test
|
Codice risultato
|
Interpretazione dei risultati
|
|
Passare
|
0
|
La correzione dello stato di iSM non era necessaria o non era abilitata nel profilo di test.
|
|
Warning
|
1
|
Lo stato di Dell iSM era in esecuzione correttamente dopo il riavvio. |
| Failure, Fail | 2 |
Dell iSM e iDRAC sono stati riavviati, ma iSM non funzionava ancora correttamente.
|
| Critica | 3 |
Questo test non ha alcun risultato critico.
|
Ogni test superato non è elencato nel report di riepilogo, per facilità di lettura.
Di seguito è riportato un esempio dell'output del controllo integrità:
#========================#======#=========#====================================================================#==============# | Hostname / Category |Status Dell_KB | Warnings or Failures, unless tests Passed ; Product S.N. | #========================#======#=========#====================================================================#==============# | _cluster | Warning 205179 | ism_fix: iSM and iDRAC fixed for node1.lab.local, node4.lab.local .| | `` | Warning 205179 | rac_fix: iSM and iDRAC fixed for node2.lab.local |L'operazione "ism_fix" viene eseguita prima dei minion e i comandi di correzione vengono eseguiti in remoto da VxRM tramite SSH. Ad esempio:
Running VxVerify 3.21.108, pre-upgrade healthcheck on VxRail 7.0.372. In case of program errors consult article https://www.dell.com/support/kbdoc/000066460. Step 1: Fixing iSM issue, prior to running health-checks, on node: lab-08-esxi-01.lab.local Step 1: Fixing iSM issue, prior to running health-checks, on node: lab-08-esxi-02.lab.local Step 1: Stopping ISM and platform service on lab-08-esxi-01.lab.local Step 1: Stopping ISM and platform service on lab-08-esxi-02.lab.local Step 1: Pausing for 266 seconds more after iDRAC restarted on ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local'] ... Step 1: Starting iSM on lab-08-esxi-01.lab.local Step 1: Starting iSM on lab-08-esxi-02.lab.local Step 1: Pausing for 84 seconds more after Dell iSM started on ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local'] ... Step 1: Starting Platform service on lab-08-esxi-01.lab.local Step 1: Starting Platform service on lab-08-esxi-02.lab.localLa correzione automatica può essere visualizzata anche nel vxv.log prima degli eventi minion_run:
2022-11-11 09:51:26-INFO [ism_fix] Fixing phase 1 Dell ISM on node on lab-08-esxi-01.lab.local 2022-11-11 09:51:31-INFO [ism_fix] lab-08-esxi-01.lab.local Auto-fix continuing with vSAN objecthealth: green 2022-11-11 09:51:32-INFO [ism_fix] iDRAC restarting on lab-08-esxi-01.lab.local: _ ... 2022-11-11 09:58:58-INFO [ism_fix] Checking hosts for auto-fix success: ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local']
Cause
- Interrompere i servizi: sfcbd, dcism, PTAgent (se presente) e Platform-service
- Riavviare iDRAC, quindi attendere 5 minuti affinché iDRAC torni online
- Avviare i servizi (elencati in precedenza)
Resolution
Lo stato di iSM viene testato nuovamente utilizzando il controllo integrità "dcism" direttamente su tale nodo. In questo modo è possibile che venga restituito un risultato diverso, perché viene eseguito il polling alcuni minuti dopo la correzione automatica. Se il risultato è diverso, il test "dcism" dovrebbe essere considerato come il risultato più accurato per lo stato dell'iSM.
I risultati dei comandi per avviare i servizi sono disponibili nel vxv.log (vedere l'articolo 66460: Guida alla risoluzione dei problemi di VxVerify ).
2022-11-25 09:16:26-DEBUG [ism_fix] node-04.lab.local iSM start: _ 2022-11-25 09:18:26-DEBUG [ism_fix] node-04.lab.local Platform service start: Starting Platform Service Daemon. Check hostd status. hostd is ready. Platform Service started. 2022-11-25 09:18:26-INFO [ism_fix] Checking hosts for auto-fix success: ['node-04.lab.local'] 2022-11-25 09:18:26-INFO [ism_check] Querying DC or Dell ISM status on host 2022-11-25 09:18:26-INFO [ism_check] iSM status on node-04.lab.local : iSM is active (running)
Se iSM non può essere risolto con la procedura descritta sopra, che il controllo integrità può eseguire automaticamente, consultare l'articolo: Dell VxRail: il controllo integrità dei nodi non riesce per il test 'dcism'
Additional Information
Forzare l'utilizzo di ism_fix (riavvio di iDRAC)
La correzione automatica viene eseguita se "dcism" o "dellism" non sono in esecuzione, quando vengono interrogati da VxRM. Tuttavia, questo vale solo se il profilo di test o l'argomento --fix abilita la correzione automatica.
In alternativa, potrebbe essere consigliato un riavvio di iDRAC per risolvere altri problemi e in modo da abilitare la correzione automatica su un argomento VxVerify.
Questo è un modo più sicuro per ripristinare la comunicazione iDRAC rispetto a un riavvio direttamente dall'interfaccia utente di iDRAC, perché VxVerify arresta iSM e i servizi correlati, prima di riavviare iDRAC e quindi ripristina i servizi nell'ordine corretto in seguito.
L'argomento override può richiedere un riavvio scaglionato di iDRAC per tutti i nodi o un elenco di nodi specifici.
Per applicare la correzione ai nodi (anche se iSM è in esecuzione normalmente), che riavvieranno iDRAC e i servizi correlati:
-
Applicare forzare la procedura di riavvio di iSM e iDRAC ("ism_fix") a tutti i nodi:
./vxverify.sh -a ism_fix=all
-
In alternativa, applicare "ism_fix" ai nodi specificati in un elenco (senza spazi) (vanno bene nomi brevi o completi):
python vxverify3.pyc <any_other_arguments> -a ism_fix=lab-08-esxi-01,lab-08-esxi-02
Gli esempi precedenti mostrano i metodi Shell e Python per l'esecuzione di VxVerify, ma gli argomenti funzionano con entrambe le sintassi.
L'argomento -a (--additional-params), consente di specificare un numero illimitato di coppie di argomenti, quindi deve venire dopo tutti gli altri argomenti standard, come --verbose
Quando viene utilizzato questo argomento, la sovrascrittura può essere visualizzata nel vxv.log come segue:
INFO [ism_fix] Running fix for Dell ISM on node: lab-08-esxi-01, due to override argument: lab-08-esxi-01.lab.local,lab-08-esxi-02.lab.local or INFO [ism_fix] Running fix for Dell ISM on node: lab-08-esxi-02, due to override argument: all