PowerScale iDRAC 發生連線問題
Summary: PowerScale F、P 和 B 系列節點會在每個月的第一天或每個星期一建立 iDRAC 連線事件。
Symptoms
PowerScale F200、F600、F900、P100 或 B100 節點會在每月第一天或每個星期一產生下列警示:
47.693031 11/01 00:20 C 3 1076769 The Integrated Dell Remote Access Controller (iDRAC) located in chassis XXXXXXX is experiencing connectivity problems. This controller monitors hardware components such as batteries and power supplies. To ensure these hardware components continue to be monitored, contact Dell EMC support as soon as possible.
Cause
有一個 cron 工作稱為 isi_security_checker 默認情況下,在每個月的第一天或每個星期一早上在群集上運行。工作執行的日期取決於安裝的 OneFS 版本。使用預設設定時,此工作可能會使 iDRAC 超載,從而觸發這些訊息。
Resolution
此問題的永久修正程式是在最新的執行狀況檢查架構 (HCF) 修補程式中。
如果您需要實作因應措施的協助,請聯絡 Dell 技術支援 部門,並引述此文章 ID。
因應措施:
-
在叢集上,建立名為 「security_checker.sh」 的檔案,路徑為
/ifs/data/Isilon_Support/在以下位置新增以下項目:for i in $(isi_nodes %{lnn}); do /usr/bin/isi_security_check/isi_security_checker -n $i --node-only; done -
開啟並編輯
/etc/mcp/templates/crontab並註解出 (#) 目前的isi_security_checker作業,然後添加新條目以運行上面創建的檔。新項目必須透過以下方式執行:isi_ropc -s -H必須通過外殼,因為/ifs已掛接noexec。#20 0 1 * * root /usr/bin/isi_security_check/isi_security_checker 20 0 1 * * root /usr/bin/isi_ropc -s -H /usr/local/bin/zsh /ifs/data/Isilon_Support/security_checker.sh
-
驗證所有節點是否都具有更新的更改(應與步驟 2 中看到的輸出匹配)。
# isi_for_array -sX "grep security_checker /etc/crontab"
-
確認所有節點都具有相同的 MD5
/etc/mcp/templates/crontab檔案中所定義。# isi_for_array -sX "md5 /etc/mcp/templates/crontab"
如果任何節點的 md5 雜湊不同,請複製
/etc/mcp/templates/crontab您修改為的檔案/ifs/data/Isilon_Support。登入使用不同 md5 值的節點,然後複製/ifs/data/Isilon_Support/crontab在現有檔上。確認權限仍維持在 640 (-rw-r-----) -
收集以下項目的目前處理 ID (PID):
cron:# isi_for_array -sX "ps -auxww | grep cron | grep -v grep"
範例:
LAB-1# isi_for_array -sX "ps -auxww | grep cron | grep -v grep" LAB-1: root 3140 0.0 0.0 25488 13016 - Is 6Oct24 0:14.15 /usr/sbin/cron -s LAB-2: root 3144 0.0 0.0 25488 13016 - Is 6Oct24 0:14.39 /usr/sbin/cron -s LAB-3: root 3173 0.0 0.0 25488 13016 - Is 6Oct24 0:14.14 /usr/sbin/cron -s
-
重新啟動
cron在群集上。# isi_for_array -sX "/etc/rc.d/cron restart"
範例:
LAB-1# isi_for_array -sX "/etc/rc.d/cron restart" LAB-1: Stopping cron. LAB-1: Waiting for PIDS: 3140. LAB-1: Starting cron. LAB-2: Stopping cron. LAB-2: Waiting for PIDS: 3144. LAB-2: Starting cron. LAB-3: Stopping cron. LAB-3: Waiting for PIDS: 3173.
-
如果您收到
Exit status 1在任何節點上,重新啟動cron在該節點上。收集目前的 PIDcron並按照步驟 5 中概述的步驟確認進程在所有節點上重新啟動(PID 應已更改)。