VxRail: o iSM "não está em execução", "executa funcionalidade limitada" ou "está inativo (inativo)"
Summary: O iSM está em um estado de "não está em execução" ou "executando funcionalidade limitada". Este artigo descreve métodos de resolução.
Symptoms
O iDRAC Service Module (iSM) é um serviço importante nos hosts para coletar informações do iDRAC para monitoramento.
Isso pode aparecer no iDRAC como o seguinte estado.
Para verificar o status do serviço iSM:
Todos os VxRail até a versão 7.0.x
/etc/init.d/dcism-netmon-watchdog status
8.0+
/etc/init.d/dellism status
Eles podem ter um dos seguintes status:
- O iSM está ativo (em execução)
- Este é o estado totalmente funcional
- iSM is active (not running)
- O iSM está ativo (executando funcionalidade limitada)
- O iSM está inativo (inativo)
Cause
Há muitas causas possíveis para esse problema. Um exemplo é que os serviços no iDRAC não estão totalmente funcionais, impedindo que o iSM converse com ele.
Qualquer causa raiz individual deve ser investigada sob a revisão técnica normal (logs, notas da versão, artigos da Base de conhecimento (KBs) etc.) e encaminhada conforme necessário usando processos padrão (CTE, DE, EE).
Resolution
Para resolver esse problema, siga as etapas abaixo:
-
Abra uma sessão SSH para cada nó em que o iSM não esteja em execução no IDRAC.
Siga as etapas abaixo em cada um dos nós:
-
Primeiro, reinicialize o iDRAC a frio para reinicializar seu sistema operacional. Cada um dos métodos a seguir é uma maneira de realizar essa tarefa; não é necessariamente para executar os três por causa disso.
/opt/vxrail/tools/ipmitool mc reset cold SSH into iDRAC (same login as web) racadm> racreset hard
-
Interrompa o serviço do iSM no nó.
7.0.x and earlier # /etc/init.d/dcism-netmon-watchdog stop 8.0 # /etc/init.d/dellism stop
-
Instale o iSMPKIHelper
# cd /opt/dell/srvadmin/iSM/bin # ./Invoke-iSMPKIHelper -install
-
Inicie o serviço do iSM no nó.
7.0.x and earlier # /etc/init.d/dcism-netmon-watchdog start 8.0 # /etc/init.d/dellism start
-
Definir serviço de 0 a 1
# esxcli system wbem set -e 0 # esxcli system wbem set -e 1
-
Execute o script SupportAssistCollection para coletar logs do iDRAC
# cd /opt/dell/srvadmin/iSM/bin # ./Invoke-SupportAssistCollection SupportAssist log Collection is in progress.. [||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||]100% Downloading the collected log file is in progress.. SupportAssist Collection logs can be found in path /tmp/TSR20190826xxxxxx_xxxxxx.zip
Se o iSM estiver "ativo (não em execução)" e não puder ser recuperado por "/etc/init.d/dcism-netmon-watchdog restart" ou "/etc/init.d/dellism": pode estar relacionado com o seguinte serviço.
Tente as seguintes etapas.
/etc/init.d/dcism-netmon-watchdog status /etc/init.d/sfcbd-watchdog stop /etc/init.d/sfcbd-watchdog start /etc/init.d/dcism-netmon-watchdog restart /etc/init.d/dcism-netmon-watchdog status
O seguinte trabalho é o mesmo que acima:
7.0.x e mais antigo
/opt/vxrail/tools/ipmitool mc reset cold ; sleep 300 ; /etc/init.d/sfcbd-watchdog stop ; /etc/init.d/dcism-netmon-watchdog stop; /etc/init.d/vxrail-pservice stop; rm /var/run/log/vxps_cache.dat ; sleep 10 ; /etc/init.d/sfcbd-watchdog start ; /etc/init.d/dcism-netmon-watchdog start; sleep 120 ; /etc/init.d/vxrail-pservice start
8.0
/opt/vxrail/tools/ipmitool mc reset cold ; sleep 300 ; /etc/init.d/sfcbd-watchdog stop ; /etc/init.d/dellism stop; /etc/init.d/vxrail-pservice stop; rm /var/run/log/vxps_cache.dat ; sleep 10 ; /etc/init.d/sfcbd-watchdog start ; /etc/init.d/dellism start; sleep 120 ; /etc/init.d/vxrail-pservice start
8.0.3xx:
/opt/platformsvc/bin/ipmitool.sh mc reset cold ; sleep 300 ; /etc/init.d/sfcbd-watchdog stop ; /etc/init.d/dellism stop; esxcli daemon control stop -s platformsvc; rm /var/run/log/vxps_cache.dat ; sleep 10 ; /etc/init.d/sfcbd-watchdog start ; /etc/init.d/dellism start; sleep 120 ; esxcli daemon control start -s platformsvc
Se o estado do iSM for "inativo (inativo)", reiniciar o serviço do iSM não mudará seu estado de inativo. A tentativa de remover, fazer upgrade ou instalar pelo iSM leva ao erro a seguir.
It is not safe to continue. Please reboot the host immediately to discard the unfinished update.
cause = ('DEL-dcism(4.1.0.0.2410-DEL.700.0.0.15843807)', "Failed to unmount tardisk dcism.v00 of VIB DEL_bootbank_dcism_4.1.0.0.2410-DEL.700.0.0.15843807: Error in running [rm /tardisks/dcism.v00]:\nReturn code: 1\nOutput: rm: can't remove '/tardisks/dcism.v00': Device or resource busy\n")
vibs = ['DEL_bootbank_dcism_4.1.0.0.2410-DEL.700.0.0.15843807']
Please refer to the log file for more details.
[root@nl93vh1012:/tardisks] localcli software vib remove -n dcism
Errors:
[LiveInstallationError]
DEL_bootbank_dcism_4.1.0.0.2410-DEL.700.0.0.15843807: Failed to unmount tardisk dcism.v00 of VIB DEL_bootbank_dcism_4.1.0.0.2410-DEL.700.0.0.15843807: Error in running [rm /tardisks/dcism.v00]:
Return code: 1
Output: rm: can't remove '/tardisks/dcism.v00': Device or resource busy
Interrompa o serviço para que ele libere seu acesso ao tardisk acima. Os processos do iSM podem iniciar o backup depois disso.
/etc/init.d/sfcbd-watchdog stop
Em seguida, você pode repetir o upgrade ou imediatamente atualizar o iSM manualmente como:
esxcli software vib update -d /vmfs/volumes/vsan\:*/upgradeBundles-*/<ISM version being upgraded to>.zip
Onde as pastas upgradeBundles do vSAN envolvem UUIDs, e a versão do ISM depende para o upgrade do VxRail.
Se isso não resolver o problema, talvez seja necessário drenar a energia do nó.
É recomendável primeiro tentar uma drenagem de energia virtual, pois isso pode ser feito remotamente. A drenagem de energia física requer acesso físico.
Dell EMC VxRail: Como realizar a drenagem de energia auxiliar remota do nó por meio do iDRAC (a conta de Suporte Dell é necessária para visualizar este artigo)
Se os problemas persistirem, é recomendável envolver o suporte técnico da Dell para obter assistência; consulte este artigo da KB.