VxRail: Хост ESXi відображається як не відповідає у vCenter, і проблема повторюється після перезавантаження хоста протягом кількох днів
Summary: Помилка iSM з помилкою TLS, якщо iDRAC9 оновлено до версії 3.30.30 під час або після оновлення iSM 3.4.
Symptoms
Може статися так, що деякі хости ESXi відображаються як такі, що не відповідають у vCenter. Перезавантаження хоста може тимчасово вирішити проблему, однак через кілька днів проблема виникає знову. Ця проблема виникає лише на серверах Dell PowerEdge 14G з iDRAC9.
У журналі TSR повідомлення на кшталт:
2019-06-04 15:26:05 ISM0049 The iDRAC Service Module (iSM) is unable to communicate to the iDRAC because the client certificate is either unavailable or invalid.
У vmkernel.log,
2019-06-04T02:05:56.920Z cpu61:2105520)WARNING: VisorFSObj: 1576: Cannot create file /etc/cim/dell/srvadmin/iSM/ini/tttttttttttttyZxIL9 for process sfcb-dcism because the inode table of its ramdisk (etc) is full.
У hostd.log,
2019-06-02T13:39:59.688Z error hostd[2105490] [Originator@6876 sub=Libs opID=e4a0107a-853b-11e9-f2a3 user=dcui:vsanmgmtd] VsanUtil: Failed to lock esx.conf /etc/vmware/esx.conf.LOCK.2104629: symlink failed: No space left on device
В інтерфейсі iDRAC
Cause
У версії iDRAC9 3.30.30 введено обов'язкову вимогу щодо створення захищеного каналу TLS з iSM v3.4.0-1471 або новішою.
Dell Engineering визначила сценарій, за якого відбувається витік пам'яті, якщо iDRAC9 ще не домовився про це безпечне з'єднання TLS, якщо iSM v3.4.0-1471 був встановлений або оновлений до оновлення прошивки iDRAC. Витік в кінцевому підсумку також призводить до втрати кількості індексних дескрипторів ядра через потік тимчасових файлів INI, створених у /etc/dell.
VxRail SW випускає інтегрований iSM 4.5.400, 4.7.200 і вище v3.4.0-1471. Обхідний шлях для запобігання цій проблемі було додано до версій 4.5.400 і 4.7.212. 4.7.210 це не вплине, оскільки це лише виробничий випуск, тому жодних оновлень до нього. Тому релізи VxRail 4.7.200 і 4.7.211, швидше за все, зіткнуться з цією проблемою.
Resolution
Перезавантажте хост ESXi, якщо він уже відображається як не відповідає у vCenter.
Повторна інсталяція iSM може спричинити повторне узгодження захищеного каналу TLS з iDRAC9 і вирішити проблему без повторення.
На уражених хостів ESXi виконайте наведені нижче команди, щоб повторно встановити iSM.
esxcli software vib remove -n dcism esxcli software vib install -d <path to iSM VIB>
Якщо в ESXi немає доступних індексних дескрипторів, ви можете спочатку видалити непотрібні файли, оскільки ця проблема також може спричинити вичерпання inode.
ls -l /etc/cim/dell/srvadmin/iSM/ini/ rm -f /etc/cim/dell/srvadmin/iSM/ini/tttttt*
Якщо системна плата була замінена через апаратний збій, також застосовуються наведені вище кроки щодо вирішення проблеми.