VxRail: El host ESXi se muestra como sin respuesta en vCenter y el problema vuelve a ocurrir después de reiniciar el host durante varios días
Summary: Se produce un error de TLS en iSM si iDRAC9 se actualiza a v3.30.30 durante o después de la actualización de iSM 3.4.
Symptoms
Puede suceder que algunos hosts ESXi se muestren como sin respuesta en vCenter. Reiniciar el host puede resolver el problema temporalmente; sin embargo, después de varios días, el problema volverá a ocurrir. Este problema solo ocurre en servidores Dell PowerEdge 14G con iDRAC9.
En el registro de TSR, se muestra un mensaje como
2019-06-04 15:26:05 ISM0049 The iDRAC Service Module (iSM) is unable to communicate to the iDRAC because the client certificate is either unavailable or invalid.
En vmkernel.log,
2019-06-04T02:05:56.920Z cpu61:2105520)WARNING: VisorFSObj: 1576: Cannot create file /etc/cim/dell/srvadmin/iSM/ini/tttttttttttttyZxIL9 for process sfcb-dcism because the inode table of its ramdisk (etc) is full.
En hostd.log,
2019-06-02T13:39:59.688Z error hostd[2105490] [Originator@6876 sub=Libs opID=e4a0107a-853b-11e9-f2a3 user=dcui:vsanmgmtd] VsanUtil: Failed to lock esx.conf /etc/vmware/esx.conf.LOCK.2104629: symlink failed: No space left on device
En la interfaz de usuario de iDRAC,
Cause
iDRAC9 v3.30.30 presentó un requisito obligatorio para crear un canal TLS seguro con iSM v3.4.0-1471 o posterior.
El equipo de ingeniería de Dell identificó una situación en la que se produce una pérdida de memoria si iDRAC9 aún no negocia esta conexión segura de TLS si iSM v3.4.0-1471 se instaló o actualizó antes de actualizar el firmware de iDRAC. Finalmente, la pérdida también causa la pérdida del conteo de inodos del kernel debido a una avalancha de archivos INI temporales creados en /etc/dell.
VxRail SW versiones 4.5.400, 4.7.200 y posteriores de iSM integrado v3.4.0-1471. Se agregó una solución alternativa para evitar este problema a 4.5.400 y 4.7.212. 4.7.210 no se ve afectado porque es una versión solo de fabricación, por lo que no hay actualizaciones. Por lo tanto, las versiones VxRail 4.7.200 y 4.7.211 tienen más probabilidades de encontrar este problema.
Resolution
Reinicie el host ESXi si ya se muestra como sin respuesta en vCenter.
La reinstalación de iSM puede activar el canal TLS seguro para renegociarse con iDRAC9 y resolver el problema para que no vuelva a ocurrir.
En los hosts ESXi afectados, ejecute los siguientes comandos para reinstalar iSM.
esxcli software vib remove -n dcism esxcli software vib install -d <path to iSM VIB>
Si no hay ningún inodo disponible en ESXi, puede eliminar primero los archivos innecesarios, ya que este problema también puede provocar que se quede sin inodo.
ls -l /etc/cim/dell/srvadmin/iSM/ini/ rm -f /etc/cim/dell/srvadmin/iSM/ini/tttttt*
Si la tarjeta madre se reemplazó debido a una falla de hardware, también se aplicarán los pasos de resolución anteriores.