PowerScale iDRAC tiene problemas de conectividad
Summary: Los nodos PowerScale serie F, P y B crean un evento de conectividad de iDRAC el primer día de cada mes o todos los lunes.
Symptoms
Los nodos PowerScale F200, F600, F900, P100 o B100 generan la siguiente alerta cada primer día del mes o todos los lunes:
47.693031 11/01 00:20 C 3 1076769 The Integrated Dell Remote Access Controller (iDRAC) located in chassis XXXXXXX is experiencing connectivity problems. This controller monitors hardware components such as batteries and power supplies. To ensure these hardware components continue to be monitored, contact Dell EMC support as soon as possible.
Cause
Hay una cron Trabajo llamado isi_security_checker que se ejecuta en el clúster de manera predeterminada, el primer día de cada mes o cada lunes por la mañana. El día en que se ejecuta el trabajo depende de la versión de OneFS que está instalada. Este trabajo puede sobrecargar la iDRAC cuando se utilizan los ajustes predeterminados, lo que activa estos mensajes.
Resolution
La corrección permanente para esto se encuentra en el parche más reciente de Health Check Framework (HCF).
Si necesita ayuda con la implementación de la solución alternativa, comuníquese con el soporte técnico de Dell y mencione el ID de este artículo.
Solución alternativa:
-
En el clúster, cree un archivo denominado "security_checker.sh" en
/ifs/data/Isilon_Support/agregando la siguiente entrada dentro:for i in $(isi_nodes %{lnn}); do /usr/bin/isi_security_check/isi_security_checker -n $i --node-only; done -
Abrir y editar
/etc/mcp/templates/crontaby comentar (#) el actualisi_security_checkery agregue una nueva entrada para ejecutar el archivo que creó anteriormente. La nueva entrada debe ejecutarse medianteisi_ropc -s -Hque debe pasar a través de un caparazón, ya que/ifsestá montadonoexec.#20 0 1 * * root /usr/bin/isi_security_check/isi_security_checker 20 0 1 * * root /usr/bin/isi_ropc -s -H /usr/local/bin/zsh /ifs/data/Isilon_Support/security_checker.sh
-
Verifique que todos los nodos tengan los cambios actualizados (que deben coincidir con el resultado observado en el paso 2).
# isi_for_array -sX "grep security_checker /etc/crontab"
-
Confirme que todos los nodos tengan el mismo MD5 para el
/etc/mcp/templates/crontabde NetWorker.# isi_for_array -sX "md5 /etc/mcp/templates/crontab"
Si el hash md5 es diferente para cualquier nodo, copie el
/etc/mcp/templates/crontabarchivo al que se modificó/ifs/data/Isilon_Support. Inicie sesión en el nodo con el valor md5 diferente y copie/ifs/data/Isilon_Support/crontabsobre el archivo existente. Verifique que los permisos sigan siendo 640 (-rw-r-----) -
Recopile el ID de proceso actual (PID) para
cron:# isi_for_array -sX "ps -auxww | grep cron | grep -v grep"
Ejemplo:
LAB-1# isi_for_array -sX "ps -auxww | grep cron | grep -v grep" LAB-1: root 3140 0.0 0.0 25488 13016 - Is 6Oct24 0:14.15 /usr/sbin/cron -s LAB-2: root 3144 0.0 0.0 25488 13016 - Is 6Oct24 0:14.39 /usr/sbin/cron -s LAB-3: root 3173 0.0 0.0 25488 13016 - Is 6Oct24 0:14.14 /usr/sbin/cron -s
-
reiniciar
cronen el clúster.# isi_for_array -sX "/etc/rc.d/cron restart"
Ejemplo:
LAB-1# isi_for_array -sX "/etc/rc.d/cron restart" LAB-1: Stopping cron. LAB-1: Waiting for PIDS: 3140. LAB-1: Starting cron. LAB-2: Stopping cron. LAB-2: Waiting for PIDS: 3144. LAB-2: Starting cron. LAB-3: Stopping cron. LAB-3: Waiting for PIDS: 3173.
-
Si recibes
Exit status 1En cualquier nodo, reinicie elcronen ese nodo. Recopile el PID actual paracrony confirme que el proceso se haya reiniciado en todos los nodos siguiendo los pasos descritos en el paso 5 (los PID deberían haber cambiado).