VxRail: Der ESXi-Host wird in vCenter als nicht reagierend angezeigt und das Problem tritt nach dem mehrtägigen Neustart des Hosts erneut auf
Summary: iSM schlägt mit TLS-Fehler fehl, wenn iDRAC9 während oder nach dem iSM 3.4-Upgrade auf v3.30.30 aktualisiert wird.
Symptoms
Es kann vorkommen, dass einige ESXi-Hosts in vCenter als nicht reagierend angezeigt werden. Durch einen Neustart des Hosts kann das Problem möglicherweise vorübergehend behoben werden, jedoch tritt es nach einigen Tagen erneut auf. Dieses Problem tritt nur auf Dell PowerEdge 14G-Servern mit iDRAC9 auf.
Im TSR-Protokoll wird eine Meldung wie
2019-06-04 15:26:05 ISM0049 The iDRAC Service Module (iSM) is unable to communicate to the iDRAC because the client certificate is either unavailable or invalid.
Im vmkernel.log
2019-06-04T02:05:56.920Z cpu61:2105520)WARNING: VisorFSObj: 1576: Cannot create file /etc/cim/dell/srvadmin/iSM/ini/tttttttttttttyZxIL9 for process sfcb-dcism because the inode table of its ramdisk (etc) is full.
Im hostd.log
2019-06-02T13:39:59.688Z error hostd[2105490] [Originator@6876 sub=Libs opID=e4a0107a-853b-11e9-f2a3 user=dcui:vsanmgmtd] VsanUtil: Failed to lock esx.conf /etc/vmware/esx.conf.LOCK.2104629: symlink failed: No space left on device
In der iDRAC-Benutzeroberfläche
Cause
Mit iDRAC9 v3.30.30 wurde eine obligatorische Anforderung zum Erstellen eines sicheren TLS-Kanals mit iSM v3.4.0-1471 oder höher eingeführt.
Dell Engineering hat ein Szenario identifiziert, in dem ein Speicherverlust auftritt, wenn iDRAC9 diese sichere TLS-Verbindung noch nicht ausgehandelt hat, wenn iSM v3.4.0-1471 installiert oder aktualisiert wurde, bevor die iDRAC-Firmware aktualisiert wurde. Das Leck führt schließlich auch zu einem Verlust der Kernel-Inode-Anzahl aufgrund einer Flut von temporären INI-Dateien, die in /etc/dell erstellt werden.
In den VxRail-Softwareversionen 4.5.400, 4.7.200 und höher wurde iSM v3.4.0-1471 integriert. Ein Workaround zur Vermeidung dieses Problems wurde zu 4.5.400 und 4.7.212 hinzugefügt. 4.7.210 ist nicht betroffen, da es sich um eine reine Fertigungsversion handelt, sodass keine Upgrades dafür notwendig sind. Daher tritt dieses Problem am ehesten bei den VxRail-Versionen 4.7.200 und 4.7.211 auf.
Resolution
Starten Sie den ESXi-Host neu, wenn er in vCenter bereits als nicht reagierend angezeigt wird.
Die Neuinstallation von iSM kann dazu führen, dass der sichere TLS-Kanal mit iDRAC9 neu verhandelt wird und das Problem nicht erneut auftritt.
Führen Sie auf den betroffenen ESXi-Hosts die folgenden Befehle aus, um iSM neu zu installieren.
esxcli software vib remove -n dcism esxcli software vib install -d <path to iSM VIB>
Wenn kein Inode im ESXi verfügbar ist, können Sie zuerst unnötige Dateien entfernen, da dieses Problem auch dazu führen kann, dass der Inode knapp wird.
ls -l /etc/cim/dell/srvadmin/iSM/ini/ rm -f /etc/cim/dell/srvadmin/iSM/ini/tttttt*
Wenn die Systemplatine aufgrund eines Hardwarefehlers ausgetauscht wurde, gelten die oben genannten Lösungsschritte ebenfalls.