VxRail. Хост ESXi отображается как не отвечающий в vCenter, и проблема возникает снова после перезагрузки хоста в течение нескольких дней
Summary: Если iDRAC9 обновляется до версии 3.30.30 во время или после модернизации iSM 3.4, iSM завершается сбоем с ошибкой TLS.
Symptoms
Может случиться так, что некоторые хосты ESXi не отвечают в vCenter. Перезагрузка хоста может временно устранить проблему, однако через несколько дней она повторится. Эта проблема возникает только на серверах Dell PowerEdge 14-го поколения с iDRAC9.
В журнале TSR появилось сообщение вида:
2019-06-04 15:26:05 ISM0049 The iDRAC Service Module (iSM) is unable to communicate to the iDRAC because the client certificate is either unavailable or invalid.
В vmkernel.log году
2019-06-04T02:05:56.920Z cpu61:2105520)WARNING: VisorFSObj: 1576: Cannot create file /etc/cim/dell/srvadmin/iSM/ini/tttttttttttttyZxIL9 for process sfcb-dcism because the inode table of its ramdisk (etc) is full.
В hostd.log
2019-06-02T13:39:59.688Z error hostd[2105490] [Originator@6876 sub=Libs opID=e4a0107a-853b-11e9-f2a3 user=dcui:vsanmgmtd] VsanUtil: Failed to lock esx.conf /etc/vmware/esx.conf.LOCK.2104629: symlink failed: No space left on device
В пользовательском интерфейсе iDRAC
Cause
В iDRAC9 v3.30.30 введено обязательное требование по созданию защищенного канала TLS с iSM v3.4.0-1471 или более поздней версии.
Специалисты инженерного отдела Dell обнаружили сценарий, при котором происходит утечка памяти, если iDRAC9 еще не согласовал это безопасное TLS-соединение, если iSM v3.4.0-1471 был установлен или обновлен до обновления микропрограммы iDRAC. Утечка в конечном итоге также приводит к потере количества индексных дескрипторов ядра из-за большого количества временных INI-файлов, созданных в /etc/dell.
ПО VxRail версий 4.5.400, 4.7.200 и более поздних версий с интегрированным ПО iSM 3.4.0-1471. Временное решение для предотвращения этой проблемы было добавлено в версии 4.5.400 и 4.7.212. Версия 4.7.210 не затронута, так как это производственная версия, поэтому обновления для нее не предусмотрены. Поэтому эта проблема чаще всего возникает в версиях VxRail 4.7.200 и 4.7.211.
Resolution
Перезагрузите хост ESXi, если он уже отображается как не отвечающий в vCenter.
Переустановка iSM может привести к повторному согласованию защищенного канала TLS с iDRAC9 и устранить проблему.
Выполните следующие команды для переустановки iSM на затронутых хостах ESXi.
esxcli software vib remove -n dcism esxcli software vib install -d <path to iSM VIB>
Если в ESXi нет доступных индексных дескрипторов, можно сначала удалить ненужные файлы, так как эта проблема также может привести к нехватке индексных дескрипторов.
ls -l /etc/cim/dell/srvadmin/iSM/ini/ rm -f /etc/cim/dell/srvadmin/iSM/ini/tttttt*
Если системная плата была заменена из-за аппаратного сбоя, также применимы указанные выше действия по устранению проблемы.