VxRail: O host do ESXi é exibido como não responsivo no vCenter e o problema ocorre novamente após a reinicialização do host por vários dias
Summary: O iSM apresentará falha com o erro TLS se o iDRAC9 receber upgrade para a versão v3.30.30 durante ou após o upgrade do iSM 3.4.
Symptoms
Pode acontecer que alguns hosts do ESXi sejam exibidos como não responsivos no vCenter. Reinicializar o host pode resolver o problema temporariamente, no entanto, depois de vários dias, o problema ocorre novamente. Esse problema só ocorre em servidores Dell PowerEdge 14G com iDRAC9.
No registro do TSR, uma mensagem como:
2019-06-04 15:26:05 ISM0049 The iDRAC Service Module (iSM) is unable to communicate to the iDRAC because the client certificate is either unavailable or invalid.
Em vmkernel.log,
2019-06-04T02:05:56.920Z cpu61:2105520)WARNING: VisorFSObj: 1576: Cannot create file /etc/cim/dell/srvadmin/iSM/ini/tttttttttttttyZxIL9 for process sfcb-dcism because the inode table of its ramdisk (etc) is full.
Em hostd.log,
2019-06-02T13:39:59.688Z error hostd[2105490] [Originator@6876 sub=Libs opID=e4a0107a-853b-11e9-f2a3 user=dcui:vsanmgmtd] VsanUtil: Failed to lock esx.conf /etc/vmware/esx.conf.LOCK.2104629: symlink failed: No space left on device
Na IU do iDRAC,
Cause
O iDRAC9 v3.30.30 introduziu um requisito obrigatório para criar um canal TLS seguro com o iSM v3.4.0-1471 ou mais recente.
A engenharia da Dell identificou um cenário em que ocorre uma perda de memória se o iDRAC9 ainda não negociou essa conexão TLS segura se o iSM v3.4.0-1471 tiver sido instalado ou atualizado antes do upgrade do firmware do iDRAC. O vazamento eventualmente também causa perda da contagem de inodes do kernel devido a uma enxurrada de arquivos INI temporários criados em /etc/dell.
VxRail SW versões 4.5.400, 4.7.200 e posteriores iSM integrado v3.4.0-1471. Uma solução temporária para evitar esse problema foi adicionada às versões 4.5.400 e 4.7.212. A versão 4.7.210 não é afetada por ser uma versão somente de fabricação, portanto, não há upgrades para ela. Portanto, as versões 4.7.200 e 4.7.211 do VxRail provavelmente encontrarão esse problema.
Resolution
Reinicialize o host do ESXi se ele já aparecer como não responsivo no vCenter.
A reinstalação do iSM pode acionar a renegociação do canal TLS seguro com o iDRAC9 e resolver o problema novamente.
Nos hosts do ESXi afetados, execute os seguintes comandos para reinstalar o iSM.
esxcli software vib remove -n dcism esxcli software vib install -d <path to iSM VIB>
Se não houver nenhum inode disponível no ESXi, você poderá remover primeiro os arquivos desnecessários, pois esse problema também pode causar o esgotamento do inode.
ls -l /etc/cim/dell/srvadmin/iSM/ini/ rm -f /etc/cim/dell/srvadmin/iSM/ini/tttttt*
Se a placa de sistema tiver sido substituída devido a uma falha de hardware, as etapas de resolução acima também se aplicarão.