L'iDRAC PowerScale presenta problemi di connettività
Summary: I nodi PowerScale serie F, P e B creano un evento di connettività iDRAC il primo giorno di ogni mese o ogni lunedì.
Symptoms
I nodi PowerScale F200, F600, F900, P100 o B100 generano il seguente avviso ogni primo giorno del mese o ogni lunedì:
47.693031 11/01 00:20 C 3 1076769 The Integrated Dell Remote Access Controller (iDRAC) located in chassis XXXXXXX is experiencing connectivity problems. This controller monitors hardware components such as batteries and power supplies. To ensure these hardware components continue to be monitored, contact Dell EMC support as soon as possible.
Cause
Esiste un cron Il lavoro chiamato isi_security_checker che viene eseguito sul cluster per impostazione predefinita, il primo di ogni mese o ogni lunedì mattina. Il giorno di esecuzione del processo dipende dalla versione di OneFS installata. Questo lavoro può causare l'overload di iDRAC quando si utilizzano le impostazioni predefinite, attivando questi messaggi.
Resolution
La correzione permanente è disponibile nell'ultima patch dell'Health Check Framework (HCF).
Se si necessita di assistenza per l'implementazione della soluzione alternativa, contattare il supporto tecnico Dell e citare l'ID di questo articolo.
Soluzione:
-
Nel cluster, creare un file denominato "security_checker.sh" in
/ifs/data/Isilon_Support/Aggiunta della seguente voce all'interno di:for i in $(isi_nodes %{lnn}); do /usr/bin/isi_security_check/isi_security_checker -n $i --node-only; done -
Apri e modifica
/etc/mcp/templates/crontabe commentare (#) l'attualeisi_security_checkerjob e aggiungere una nuova voce per eseguire il file creato in precedenza. La nuova voce deve essere eseguita utilizzandoisi_ropc -s -Hche deve essere fatto passare attraverso una conchiglia, poiché/ifsè montatonoexec.#20 0 1 * * root /usr/bin/isi_security_check/isi_security_checker 20 0 1 * * root /usr/bin/isi_ropc -s -H /usr/local/bin/zsh /ifs/data/Isilon_Support/security_checker.sh
-
Verificare che tutti i nodi dispongano delle modifiche aggiornate (che devono corrispondere all'output visualizzato nel passaggio 2).
# isi_for_array -sX "grep security_checker /etc/crontab"
-
Verificare che tutti i nodi abbiano lo stesso MD5 per
/etc/mcp/templates/crontabdi NetWorker.# isi_for_array -sX "md5 /etc/mcp/templates/crontab"
Se l'hash md5 è diverso per qualsiasi nodo, copiare il file
/etc/mcp/templates/crontabFile modificato in/ifs/data/Isilon_Support. Accedere al nodo con il diverso valore md5 e copiare/ifs/data/Isilon_Support/crontabsul file esistente. Verificare che le autorizzazioni rimangano 640 (-rw-r-----) -
Raccogliere l'ID processo corrente (PID) per
cron:# isi_for_array -sX "ps -auxww | grep cron | grep -v grep"
Esempio:
LAB-1# isi_for_array -sX "ps -auxww | grep cron | grep -v grep" LAB-1: root 3140 0.0 0.0 25488 13016 - Is 6Oct24 0:14.15 /usr/sbin/cron -s LAB-2: root 3144 0.0 0.0 25488 13016 - Is 6Oct24 0:14.39 /usr/sbin/cron -s LAB-3: root 3173 0.0 0.0 25488 13016 - Is 6Oct24 0:14.14 /usr/sbin/cron -s
-
Riavvia
cronsul cluster.# isi_for_array -sX "/etc/rc.d/cron restart"
Esempio:
LAB-1# isi_for_array -sX "/etc/rc.d/cron restart" LAB-1: Stopping cron. LAB-1: Waiting for PIDS: 3140. LAB-1: Starting cron. LAB-2: Stopping cron. LAB-2: Waiting for PIDS: 3144. LAB-2: Starting cron. LAB-3: Stopping cron. LAB-3: Waiting for PIDS: 3173.
-
Se ricevi
Exit status 1Su qualsiasi nodo, riavviare ilcronsu tale nodo. Raccogliere il PID corrente percrone verificare che il processo sia stato riavviato su tutti i nodi seguendo la procedura descritta nel passaggio 5 (i PID dovrebbero essere cambiati).