「VxRail:ESXiホストがvCenterで応答しないと表示され、ホストを数日間再起動した後に問題が再発する
Summary: iSM 3.4のアップグレード中またはアップグレード後にiDRAC9をv3.30.30にアップグレードした場合、iSMはTLSエラーで失敗します。
Symptoms
一部のESXiホストがvCenterで応答しないと表示されることがあります。ホストを再起動すると、一時的に問題が解決する場合がありますが、数日後に問題が再発します。この問題は、iDRAC9搭載のDell PowerEdge 14Gサーバーでのみ発生します。
TSRログには、次のようなメッセージが記録されます。
2019-06-04 15:26:05 ISM0049 The iDRAC Service Module (iSM) is unable to communicate to the iDRAC because the client certificate is either unavailable or invalid.
vmkernel.logでは、
2019-06-04T02:05:56.920Z cpu61:2105520)WARNING: VisorFSObj: 1576: Cannot create file /etc/cim/dell/srvadmin/iSM/ini/tttttttttttttyZxIL9 for process sfcb-dcism because the inode table of its ramdisk (etc) is full.
hostd.logでは、
2019-06-02T13:39:59.688Z error hostd[2105490] [Originator@6876 sub=Libs opID=e4a0107a-853b-11e9-f2a3 user=dcui:vsanmgmtd] VsanUtil: Failed to lock esx.conf /etc/vmware/esx.conf.LOCK.2104629: symlink failed: No space left on device
iDRAC UIでは、
Cause
iDRAC9 v3.30.30では、iSM v3.4.0-1471以降でセキュアなTLSチャネルを作成するための必須要件が導入されました
Dellエンジニアリングは、iDRACファームウェアをアップグレードする前にiSM v3.4.0-1471をインストールまたはアップグレードした場合に、iDRAC9がまだこのセキュアなTLS接続をネゴシエートしていない場合にメモリー リークが発生するシナリオを特定しました。このリークにより、/etc/dellに作成される一時INIファイルが大量に発生するため、最終的にはカーネルinode数も失われます
VxRail SWリリース4.5.400、4.7.200以降の統合iSM v3.4.0-1471。この問題を回避するための回避策が4.5.400および4.7.212に追加されました。4.7.210は、製造のみのリリースであり、アップグレードは行われないため、影響を受けません。したがって、VxRail 4.7.200および4.7.211リリースでこの問題が発生する可能性が最も高くなります。
Resolution
すでにvCenterで応答していないと表示されている場合は、ESXiホストを再起動します。
iSMを再インストールすると、セキュアなTLSチャネルがiDRAC9と再ネゴシエートされ、問題の再発を解決できます。
影響を受けるESXiホストで、次のコマンドを実行してiSMを再インストールします。
esxcli software vib remove -n dcism esxcli software vib install -d <path to iSM VIB>
ESXiで使用可能なinodeがない場合は、この問題によってinodeが不足する可能性があるため、最初に不要なファイルを削除することをお勧めします。
ls -l /etc/cim/dell/srvadmin/iSM/ini/ rm -f /etc/cim/dell/srvadmin/iSM/ini/tttttt*
ハードウェア障害によりシステム ボードを交換した場合は、前述の解決手順も適用されます。