PowerScale iDRAC испытывает проблемы с подключением
Summary: Узлы PowerScale серий F, P и B создают событие подключения iDRAC в первый день каждого месяца или каждый понедельник.
Symptoms
Узлы PowerScale F200, F600, F900, P100 или B100 создают следующие оповещения каждый первый день месяца или каждый понедельник:
47.693031 11/01 00:20 C 3 1076769 The Integrated Dell Remote Access Controller (iDRAC) located in chassis XXXXXXX is experiencing connectivity problems. This controller monitors hardware components such as batteries and power supplies. To ensure these hardware components continue to be monitored, contact Dell EMC support as soon as possible.
Cause
Существует cron Работа по имени isi_security_checker , который запускается в кластере по умолчанию, первого числа каждого месяца или каждое утро понедельника. День запуска задания зависит от установленной версии OneFS. Это задание может привести к перегрузке iDRAC при использовании настроек по умолчанию, что приводит к появлению этих сообщений.
Resolution
Окончательное исправление этой проблемы реализовано в последнем исправлении Health Check Framework (HCF).
Если вам нужна помощь в реализации временного решения, обратитесь в службу технической поддержки Dell и укажите идентификатор этой статьи.
Решение:
-
Создайте в кластере файл с именем «security_checker.sh» в разделе
/ifs/data/Isilon_Support/Добавление следующей записи в:for i in $(isi_nodes %{lnn}); do /usr/bin/isi_security_check/isi_security_checker -n $i --node-only; done -
Открыть и редактировать
/etc/mcp/templates/crontabи закомментируем (#) текущуюisi_security_checkerjob и добавьте новую запись для запуска созданного выше файла. Новая запись должна выполняться с помощьюisi_ropc -s -Hкоторый должен быть пропущен через оболочку, так как/ifsмонтируетсяnoexec.#20 0 1 * * root /usr/bin/isi_security_check/isi_security_checker 20 0 1 * * root /usr/bin/isi_ropc -s -H /usr/local/bin/zsh /ifs/data/Isilon_Support/security_checker.sh
-
Убедитесь, что на всех узлах есть обновленные изменения (которые должны совпадать с выводом, показанным на шаге 2).
# isi_for_array -sX "grep security_checker /etc/crontab"
-
Убедитесь, что все узлы имеют одинаковый MD5 для
/etc/mcp/templates/crontab.# isi_for_array -sX "md5 /etc/mcp/templates/crontab"
Если хэш md5 отличается для какого-либо узла, скопируйте файл
/etc/mcp/templates/crontabфайл, который вы изменили/ifs/data/Isilon_Support. Войдите в узел с другим значением md5 и скопируйте/ifs/data/Isilon_Support/crontabповерх существующего файла. Убедитесь, что разрешения остаются в силе 640 (-rw-r-----) -
Соберите текущий идентификатор процесса (PID) для
cron.# isi_for_array -sX "ps -auxww | grep cron | grep -v grep"
Пример:
LAB-1# isi_for_array -sX "ps -auxww | grep cron | grep -v grep" LAB-1: root 3140 0.0 0.0 25488 13016 - Is 6Oct24 0:14.15 /usr/sbin/cron -s LAB-2: root 3144 0.0 0.0 25488 13016 - Is 6Oct24 0:14.39 /usr/sbin/cron -s LAB-3: root 3173 0.0 0.0 25488 13016 - Is 6Oct24 0:14.14 /usr/sbin/cron -s
-
Restart
cronв кластере.# isi_for_array -sX "/etc/rc.d/cron restart"
Пример:
LAB-1# isi_for_array -sX "/etc/rc.d/cron restart" LAB-1: Stopping cron. LAB-1: Waiting for PIDS: 3140. LAB-1: Starting cron. LAB-2: Stopping cron. LAB-2: Waiting for PIDS: 3144. LAB-2: Starting cron. LAB-3: Stopping cron. LAB-3: Waiting for PIDS: 3173.
-
Если вы получили
Exit status 1На любом узле перезапуститеcronна этом узле. Соберите текущий PID дляcronи убедитесь, что процесс перезапущен на всех узлах, выполнив действия, описанные на шаге 5 (PID должны были измениться).