PowerScale iDRAC 遇到连接问题
Summary: PowerScale F、P 和 B 系列节点在每个月的第一天或每个星期一创建一个 iDRAC 连接事件。
Symptoms
PowerScale F200、F600、F900、P100 或 B100 节点在每个月的第一天或每个星期一生成以下警报:
47.693031 11/01 00:20 C 3 1076769 The Integrated Dell Remote Access Controller (iDRAC) located in chassis XXXXXXX is experiencing connectivity problems. This controller monitors hardware components such as batteries and power supplies. To ensure these hardware components continue to be monitored, contact Dell EMC support as soon as possible.
Cause
有一个 cron 作业调用 isi_security_checker 默认情况下,在每月 1 日或每个星期一早上在群集上运行。作业运行的日期取决于安装的 OneFS 版本。此作业在使用默认设置时可能会使 iDRAC 过载,从而触发这些消息。
Resolution
此问题的永久修复程序包含在最新的运行状况检查框架 (HCF) 修补程序中。
如果您在实施解决方法方面需要帮助,请联系戴尔技术支持 并引用本文 ID。
解决 方案:
-
在群集上,在以下位置下创建名为 “security_checker.sh” 的文件
/ifs/data/Isilon_Support/在 中添加以下条目:for i in $(isi_nodes %{lnn}); do /usr/bin/isi_security_check/isi_security_checker -n $i --node-only; done -
打开和编辑
/etc/mcp/templates/crontab并注释掉 (#) 当前isi_security_checker作业并添加一个新条目来运行您在上面创建的文件。新条目必须使用isi_ropc -s -H它必须通过外壳,因为/ifs已安装noexec。#20 0 1 * * root /usr/bin/isi_security_check/isi_security_checker 20 0 1 * * root /usr/bin/isi_ropc -s -H /usr/local/bin/zsh /ifs/data/Isilon_Support/security_checker.sh
-
验证所有节点是否都具有更新的更改(应与步骤 2 中看到的输出匹配)。
# isi_for_array -sX "grep security_checker /etc/crontab"
-
确认所有节点的 MD5 相同
/etc/mcp/templates/crontab文件中定义。# isi_for_array -sX "md5 /etc/mcp/templates/crontab"
如果任何节点的 md5 哈希都不同,请复制
/etc/mcp/templates/crontab您修改为的文件/ifs/data/Isilon_Support。登录到具有不同 md5 值的节点,然后拷贝/ifs/data/Isilon_Support/crontab在现有文件上。验证权限是否保持为 640 (-rw-r-----) -
收集当前进程 ID (PID)
cron管理此进程:# isi_for_array -sX "ps -auxww | grep cron | grep -v grep"
示例:
LAB-1# isi_for_array -sX "ps -auxww | grep cron | grep -v grep" LAB-1: root 3140 0.0 0.0 25488 13016 - Is 6Oct24 0:14.15 /usr/sbin/cron -s LAB-2: root 3144 0.0 0.0 25488 13016 - Is 6Oct24 0:14.39 /usr/sbin/cron -s LAB-3: root 3173 0.0 0.0 25488 13016 - Is 6Oct24 0:14.14 /usr/sbin/cron -s
-
重新启动
cron在群集上。# isi_for_array -sX "/etc/rc.d/cron restart"
示例:
LAB-1# isi_for_array -sX "/etc/rc.d/cron restart" LAB-1: Stopping cron. LAB-1: Waiting for PIDS: 3140. LAB-1: Starting cron. LAB-2: Stopping cron. LAB-2: Waiting for PIDS: 3144. LAB-2: Starting cron. LAB-3: Stopping cron. LAB-3: Waiting for PIDS: 3173.
-
如果您收到
Exit status 1在任何节点上,重新启动cron在该节点上。收集当前 PID,用于cron并按照步骤 5 中概述的步骤确认进程已在所有节点上重新启动(PID 应已更改)。