Dell VxRail: verificação de integridade "ism_fix" ou "rac_fix" para corrigir problemas do iSM e do iDRAC
Summary: O VxVerify no VxRail Manager pode tentar corrigir a falha do iDRAC e do iSM reiniciando o iDRAC e os serviços de nó relacionados ao VxRail.
Symptoms
Antes de executar testes diretamente em cada nó, usando o minion do VxVerify, o VxVerify no VxRail Manager primeiro consulta o Dell iSM (dcism ou dellism).
Como alternativa, se forem encontrados problemas do iDRAC ao executar verificações de integridade, essa correção automática será tentada antes de repetir as verificações de integridade.
Se a opção Autofix estiver ativada (pelo perfil de teste ou com o argumento --fix), a tentativa de corrigir isso levará cerca de 10 minutos.
O resultado dessa correção automática é listado como um dos seguintes:
|
Resultado do teste
|
Código do resultado
|
Interpretação dos Resultados
|
|
Passar
|
0
|
A correção do status do iSM era desnecessária ou não estava ativada no perfil de teste.
|
|
Warning
|
1
|
O status do Dell iSM estava sendo executado corretamente após a reinicialização. |
| Falha | 2 |
O Dell iSM e o iDRAC foram reiniciados, mas o iSM ainda não estava sendo executado corretamente posteriormente.
|
| Crítica | 3 |
Este teste não tem nenhum resultado crítico.
|
Cada teste aprovado não é listado no relatório de resumo, para facilitar a leitura.
Um exemplo do resultado da verificação de integridade é mostrado abaixo:
#========================#======#=========#====================================================================#==============# | Hostname / Category |Status Dell_KB | Warnings or Failures, unless tests Passed ; Product S.N. | #========================#======#=========#====================================================================#==============# | _cluster | Warning 205179 | ism_fix: iSM and iDRAC fixed for node1.lab.local, node4.lab.local .| | `` | Warning 205179 | rac_fix: iSM and iDRAC fixed for node2.lab.local |A operação "ism_fix" é executada antes dos minions e os comandos de correção são executados remotamente a partir do VxRM usando SSH. Por exemplo:
Running VxVerify 3.21.108, pre-upgrade healthcheck on VxRail 7.0.372. In case of program errors consult article https://www.dell.com/support/kbdoc/000066460. Step 1: Fixing iSM issue, prior to running health-checks, on node: lab-08-esxi-01.lab.local Step 1: Fixing iSM issue, prior to running health-checks, on node: lab-08-esxi-02.lab.local Step 1: Stopping ISM and platform service on lab-08-esxi-01.lab.local Step 1: Stopping ISM and platform service on lab-08-esxi-02.lab.local Step 1: Pausing for 266 seconds more after iDRAC restarted on ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local'] ... Step 1: Starting iSM on lab-08-esxi-01.lab.local Step 1: Starting iSM on lab-08-esxi-02.lab.local Step 1: Pausing for 84 seconds more after Dell iSM started on ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local'] ... Step 1: Starting Platform service on lab-08-esxi-01.lab.local Step 1: Starting Platform service on lab-08-esxi-02.lab.localA correção automática também pode ser vista no vxv.log anterior aos eventos minion_run:
2022-11-11 09:51:26-INFO [ism_fix] Fixing phase 1 Dell ISM on node on lab-08-esxi-01.lab.local 2022-11-11 09:51:31-INFO [ism_fix] lab-08-esxi-01.lab.local Auto-fix continuing with vSAN objecthealth: green 2022-11-11 09:51:32-INFO [ism_fix] iDRAC restarting on lab-08-esxi-01.lab.local: _ ... 2022-11-11 09:58:58-INFO [ism_fix] Checking hosts for auto-fix success: ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local']
Cause
- Interromper serviços: sfcbd, dcism, PTAgent (se houver) & Platform-service
- Reinicie o iDRAC e aguarde 5 minutos até que ele volte a ficar on-line
- Iniciar serviços (listados acima)
Resolution
O status do iSM é testado novamente usando a verificação de integridade "dcism" diretamente nesse nó. Isso pode relatar um resultado diferente, porque ele é consultado alguns minutos após a correção automática. Se o resultado for diferente, o teste "dcism" deve ser visto como o resultado mais preciso para o status do iSM.
Os resultados dos comandos para iniciar os serviços podem ser encontrados no vxv.log (consulte o artigo 66460: Guia de solução de problemas do VxVerify ).
2022-11-25 09:16:26-DEBUG [ism_fix] node-04.lab.local iSM start: _ 2022-11-25 09:18:26-DEBUG [ism_fix] node-04.lab.local Platform service start: Starting Platform Service Daemon. Check hostd status. hostd is ready. Platform Service started. 2022-11-25 09:18:26-INFO [ism_fix] Checking hosts for auto-fix success: ['node-04.lab.local'] 2022-11-25 09:18:26-INFO [ism_check] Querying DC or Dell ISM status on host 2022-11-25 09:18:26-INFO [ism_check] iSM status on node-04.lab.local : iSM is active (running)
Se o iSM não puder ser corrigido pelas etapas acima, que a verificação de integridade pode executar automaticamente, consulte o artigo: Dell VxRail: O Health Check do nó falha no teste "dcism"
Additional Information
Forçar o uso do ism_fix (reinicialização do iDRAC)
O Autofix será executado se "dcism" ou "dellism" não estiverem em execução, quando forem consultados a partir do VxRM. No entanto, isso só se aplicará se o perfil de teste ou o argumento --fix habilitar a correção automática.
Como alternativa, uma reinicialização do iDRAC pode ser recomendada para resolver outros problemas e, portanto, a correção automática pode ser ativada em um argumento do VxVerify.
Essa é uma maneira mais segura de recuperar a comunicação do iDRAC do que reiniciar diretamente da interface do usuário do iDRAC, pois o VxVerify desligará o iSM e os serviços relacionados antes de reiniciar o iDRAC e, depois, reativará os serviços na ordem correta.
O argumento de substituição pode solicitar que todos os nós tenham uma reinicialização escalonada do iDRAC ou uma lista de nós específicos.
Para aplicar a correção aos nós (mesmo se o iSM estiver funcionando normalmente), o que reiniciará o iDRAC e os serviços relacionados:
-
Aplique o procedimento de reinicialização forçada do iSM e do iDRAC ("ism_fix") a todos os nós:
./vxverify.sh -a ism_fix=all
-
Ou aplique "ism_fix" a nós especificados em uma lista (sem espaços) (nomes curtos ou totalmente qualificados funcionarão):
python vxverify3.pyc <any_other_arguments> -a ism_fix=lab-08-esxi-01,lab-08-esxi-02
Os exemplos acima mostram os métodos Shell e Python de execução do VxVerify, mas os argumentos funcionarão com qualquer sintaxe.
O argumento -a (--additional-params), permite que um número ilimitado de pares de argumentos seja especificado, então ele deve vir depois de todos os outros argumentos padrão, como --verbose
Quando esse argumento é usado, a substituição pode ser vista no vxv.log da seguinte maneira:
INFO [ism_fix] Running fix for Dell ISM on node: lab-08-esxi-01, due to override argument: lab-08-esxi-01.lab.local,lab-08-esxi-02.lab.local or INFO [ism_fix] Running fix for Dell ISM on node: lab-08-esxi-02, due to override argument: all