VxRail: El host ESXi se muestra como sin respuesta en vCenter y el problema vuelve a ocurrir después de reiniciar el host durante varios días

Summary: Se produce un error de TLS en iSM si iDRAC9 se actualiza a v3.30.30 durante o después de la actualización de iSM 3.4.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Puede suceder que algunos hosts ESXi se muestren como sin respuesta en vCenter. Reiniciar el host puede resolver el problema temporalmente; sin embargo, después de varios días, el problema volverá a ocurrir. Este problema solo ocurre en servidores Dell PowerEdge 14G con iDRAC9.

En el registro de TSR, se muestra un mensaje como

2019-06-04 15:26:05 ISM0049 The iDRAC Service Module (iSM) is unable to communicate to the iDRAC because the client certificate is either unavailable or invalid.

En vmkernel.log,

2019-06-04T02:05:56.920Z cpu61:2105520)WARNING: VisorFSObj: 1576: Cannot create file /etc/cim/dell/srvadmin/iSM/ini/tttttttttttttyZxIL9 for process sfcb-dcism because the inode table of its ramdisk (etc) is full.

En hostd.log,

2019-06-02T13:39:59.688Z error hostd[2105490] [Originator@6876 sub=Libs opID=e4a0107a-853b-11e9-f2a3 user=dcui:vsanmgmtd] VsanUtil: Failed to lock esx.conf /etc/vmware/esx.conf.LOCK.2104629: symlink failed: No space left on device

En la interfaz de usuario de iDRAC,
En la interfaz de usuario de iDRAC, se muestran fallas de iSM

 

Cause

iDRAC9 v3.30.30 presentó un requisito obligatorio para crear un canal TLS seguro con iSM v3.4.0-1471 o posterior.

El equipo de ingeniería de Dell identificó una situación en la que se produce una pérdida de memoria si iDRAC9 aún no negocia esta conexión segura de TLS si iSM v3.4.0-1471 se instaló o actualizó antes de actualizar el firmware de iDRAC. Finalmente, la pérdida también causa la pérdida del conteo de inodos del kernel debido a una avalancha de archivos INI temporales creados en /etc/dell.

VxRail SW versiones 4.5.400, 4.7.200 y posteriores de iSM integrado v3.4.0-1471. Se agregó una solución alternativa para evitar este problema a 4.5.400 y 4.7.212. 4.7.210 no se ve afectado porque es una versión solo de fabricación, por lo que no hay actualizaciones. Por lo tanto, las versiones VxRail 4.7.200 y 4.7.211 tienen más probabilidades de encontrar este problema.

Nota: También es posible que se produzca este problema si la tarjeta madre se reemplazó debido a una falla de hardware. Esto se aplica a los nodos que ejecutan 4.7.2xx [incluido 4.7.212 y código futuro]

 

Resolution

Reinicie el host ESXi si ya se muestra como sin respuesta en vCenter.

La reinstalación de iSM puede activar el canal TLS seguro para renegociarse con iDRAC9 y resolver el problema para que no vuelva a ocurrir.

En los hosts ESXi afectados, ejecute los siguientes comandos para reinstalar iSM.

esxcli software vib remove -n dcism
esxcli software vib install -d <path to iSM VIB>

Si no hay ningún inodo disponible en ESXi, puede eliminar primero los archivos innecesarios, ya que este problema también puede provocar que se quede sin inodo.

ls -l /etc/cim/dell/srvadmin/iSM/ini/
rm -f /etc/cim/dell/srvadmin/iSM/ini/tttttt*

Si la tarjeta madre se reemplazó debido a una falla de hardware, también se aplicarán los pasos de resolución anteriores.

 

Affected Products

VxRail Appliance Series

Products

VxRail Appliance Series
Article Properties
Article Number: 000060464
Article Type: Solution
Last Modified: 29 Nov 2024
Version:  4
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.