Dell VxRail: controllo integrità "ism_fix" o "rac_fix" per la correzione dei problemi di iSM e iDRAC

Summary: VxVerify su VxRail Manager può tentare di correggere gli errori di iDRAC e iSM riavviando iDRAC e i relativi servizi dei nodi VxRail.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

VxVerify su VxRail Manager può tentare di correggere gli errori di iDRAC e iSM riavviando iDRAC e i relativi servizi dei nodi VxRail.
Prima di eseguire i test direttamente su ciascun nodo, utilizzando il minion VxVerify, VxVerify su VxRail Manager esegue una query sull'iSM Dell (dcism o dellism).
In alternativa, se sono stati rilevati problemi di iDRAC durante l'esecuzione dei controlli integrità, viene tentata questa correzione automatica prima di ritentare i controlli integrità.
Se l'opzione Autofix è abilitata (dal profilo di test o con l'argomento --fix), il tentativo di correggere questa condizione richiede circa 10 minuti.

Il risultato di questa correzione automatica è elencato come uno dei seguenti:
Risultato del test
Codice risultato
    Interpretazione dei risultati
Passare
0
La correzione dello stato di iSM non era necessaria o non era abilitata nel profilo di test.
Warning
1
Lo stato di Dell iSM era in esecuzione correttamente dopo il riavvio.
Failure, Fail 2
Dell iSM e iDRAC sono stati riavviati, ma iSM non funzionava ancora correttamente.
Critica 3
Questo test non ha alcun risultato critico.
Questa correzione può essere attivata anche dopo l'esecuzione dei controlli di VxVerify, se le query di iDRAC hanno esito negativo. In tal caso, il minion VxVerify verrà eseguito una seconda volta dopo la correzione. I test ripetuti verificano se i problemi di iSM e iDRAC sono stati risolti.
Ogni test superato non è elencato nel report di riepilogo, per facilità di lettura.
Di seguito è riportato un esempio dell'output del controllo integrità:
#========================#======#=========#====================================================================#==============#
|  Hostname / Category   |Status  Dell_KB |  Warnings or Failures, unless tests Passed                         ; Product S.N. |
#========================#======#=========#====================================================================#==============#
| _cluster               | Warning 205179 | ism_fix: iSM and iDRAC fixed for node1.lab.local, node4.lab.local                .|
|   ``                   | Warning 205179 | rac_fix: iSM and iDRAC fixed for node2.lab.local                                  |

L'operazione "ism_fix" viene eseguita prima dei minion e i comandi di correzione vengono eseguiti in remoto da VxRM tramite SSH. Ad esempio:
Running VxVerify 3.21.108, pre-upgrade healthcheck on VxRail 7.0.372.
In case of program errors consult article https://www.dell.com/support/kbdoc/000066460.
Step 1: Fixing iSM issue, prior to running health-checks, on node: lab-08-esxi-01.lab.local
Step 1: Fixing iSM issue, prior to running health-checks, on node: lab-08-esxi-02.lab.local
Step 1: Stopping ISM and platform service on lab-08-esxi-01.lab.local
Step 1: Stopping ISM and platform service on lab-08-esxi-02.lab.local
Step 1: Pausing for 266 seconds more after iDRAC restarted on ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local'] 
... 
Step 1: Starting iSM on lab-08-esxi-01.lab.local
Step 1: Starting iSM on lab-08-esxi-02.lab.local
Step 1: Pausing for 84 seconds more after Dell iSM started on ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local']
...
Step 1: Starting Platform service on lab-08-esxi-01.lab.local
Step 1: Starting Platform service on lab-08-esxi-02.lab.local
La correzione automatica può essere visualizzata anche nel vxv.log prima degli eventi minion_run:
2022-11-11 09:51:26-INFO     [ism_fix] Fixing phase 1 Dell ISM on node on lab-08-esxi-01.lab.local
2022-11-11 09:51:31-INFO     [ism_fix] lab-08-esxi-01.lab.local Auto-fix continuing with vSAN objecthealth: green
2022-11-11 09:51:32-INFO     [ism_fix] iDRAC restarting on lab-08-esxi-01.lab.local: _
...
2022-11-11 09:58:58-INFO     [ism_fix] Checking hosts for auto-fix success: ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local']

Cause

Per correggere DCISM non in esecuzione, la seguente procedura viene eseguita da VxVerify, se questa funzione di correzione automatica è abilitata nel profilo di test:
  • Interrompere i servizi: sfcbd, dcism, PTAgent (se presente) e Platform-service
  • Riavviare iDRAC, quindi attendere 5 minuti affinché iDRAC torni online
  • Avviare i servizi (elencati in precedenza)

Resolution

La correzione automatica per iSM segnala l'esito positivo o negativo a seconda dello stato "dcism" o "dellism", quando viene eseguito il polling in remoto da VxVerify. I servitori vengono quindi avviati normalmente.
Lo stato di iSM viene testato nuovamente utilizzando il controllo integrità "dcism" direttamente su tale nodo. In questo modo è possibile che venga restituito un risultato diverso, perché viene eseguito il polling alcuni minuti dopo la correzione automatica. Se il risultato è diverso, il test "dcism" dovrebbe essere considerato come il risultato più accurato per lo stato dell'iSM.

I risultati dei comandi per avviare i servizi sono disponibili nel vxv.log (vedere l'articolo 66460: Guida alla risoluzione dei problemi di VxVerify ).
2022-11-25 09:16:26-DEBUG    [ism_fix] node-04.lab.local iSM start: _
2022-11-25 09:18:26-DEBUG    [ism_fix] node-04.lab.local Platform service start: Starting Platform Service Daemon. Check hostd status. hostd is ready. Platform Service started.
2022-11-25 09:18:26-INFO     [ism_fix] Checking hosts for auto-fix success: ['node-04.lab.local']
2022-11-25 09:18:26-INFO     [ism_check] Querying DC or Dell ISM status on host
2022-11-25 09:18:26-INFO     [ism_check] iSM status on node-04.lab.local : iSM is active (running)

Se iSM non può essere risolto con la procedura descritta sopra, che il controllo integrità può eseguire automaticamente, consultare l'articolo: Dell VxRail: il controllo integrità dei nodi non riesce per il test 'dcism'

Additional Information

Forzare l'utilizzo di ism_fix (riavvio di iDRAC)

La correzione automatica viene eseguita se "dcism" o "dellism" non sono in esecuzione, quando vengono interrogati da VxRM. Tuttavia, questo vale solo se il profilo di test o l'argomento --fix abilita la correzione automatica.
In alternativa, potrebbe essere consigliato un riavvio di iDRAC per risolvere altri problemi e in modo da abilitare la correzione automatica su un argomento VxVerify. 
Questo è un modo più sicuro per ripristinare la comunicazione iDRAC rispetto a un riavvio direttamente dall'interfaccia utente di iDRAC, perché VxVerify arresta iSM e i servizi correlati, prima di riavviare iDRAC e quindi ripristina i servizi nell'ordine corretto in seguito.
L'argomento override può richiedere un riavvio scaglionato di iDRAC per tutti i nodi o un elenco di nodi specifici.

Per applicare la correzione ai nodi (anche se iSM è in esecuzione normalmente), che riavvieranno iDRAC e i servizi correlati:

  • Applicare forzare la procedura di riavvio di iSM e iDRAC ("ism_fix") a tutti i nodi:

./vxverify.sh -a ism_fix=all​​​
  • In alternativa, applicare "ism_fix" ai nodi specificati in un elenco (senza spazi) (vanno bene nomi brevi o completi):

python vxverify3.pyc <any_other_arguments> -a ism_fix=lab-08-esxi-01,lab-08-esxi-02

Gli esempi precedenti mostrano i metodi Shell e Python per l'esecuzione di VxVerify, ma gli argomenti funzionano con entrambe le sintassi.
L'argomento -a (--additional-params), consente di specificare un numero illimitato di coppie di argomenti, quindi deve venire dopo tutti gli altri argomenti standard, come --verbose

Quando viene utilizzato questo argomento, la sovrascrittura può essere visualizzata nel vxv.log come segue:

INFO [ism_fix] Running fix for Dell ISM on node: lab-08-esxi-01, due to override argument: lab-08-esxi-01.lab.local,lab-08-esxi-02.lab.local
or 
INFO [ism_fix] Running fix for Dell ISM on node: lab-08-esxi-02, due to override argument: all 

Affected Products

VxRail, iDRAC Service Module, VxRail Appliance Family, VxRail Appliance Series, VxRail Software
Article Properties
Article Number: 000205179
Article Type: Solution
Last Modified: 18 Dec 2024
Version:  12
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.