O iDRAC do PowerScale está enfrentando problemas de conectividade
Summary: Os nós do PowerScale séries F, P e B criam um evento de conectividade do iDRAC no primeiro dia de cada mês ou todas as segundas-feiras.
Symptoms
Os nós do PowerScale F200, F600, F900, P100 ou B100 geram o seguinte alerta no primeiro dia do mês ou todas as segundas-feiras:
47.693031 11/01 00:20 C 3 1076769 The Integrated Dell Remote Access Controller (iDRAC) located in chassis XXXXXXX is experiencing connectivity problems. This controller monitors hardware components such as batteries and power supplies. To ensure these hardware components continue to be monitored, contact Dell EMC support as soon as possible.
Cause
Há um cron trabalho chamado isi_security_checker que é executado no cluster por padrão, no primeiro dia de cada mês ou todas as segundas-feiras pela manhã. O dia em que o trabalho é executado depende da versão do OneFS instalada. Esse trabalho pode sobrecarregar o iDRAC ao usar as configurações padrão, acionando essas mensagens.
Resolution
A correção permanente para isso está no patch mais recente do Health Check Framework (HCF).
Se precisar de ajuda para implementar a solução temporária, entre em contato com o suporte técnico da Dell e mencione o ID deste artigo.
Solução alternativa:
-
No cluster, crie um arquivo chamado "security_checker.sh" em
/ifs/data/Isilon_Support/Adicionando a seguinte entrada em:for i in $(isi_nodes %{lnn}); do /usr/bin/isi_security_check/isi_security_checker -n $i --node-only; done -
Abrir e editar
/etc/mcp/templates/crontabe comentar (#) o atualisi_security_checkere adicione uma nova entrada para executar o arquivo criado acima. A nova entrada deve ser executada usando:isi_ropc -s -Hque deve ser passada através de uma concha, desde que/ifsestá montadonoexec.#20 0 1 * * root /usr/bin/isi_security_check/isi_security_checker 20 0 1 * * root /usr/bin/isi_ropc -s -H /usr/local/bin/zsh /ifs/data/Isilon_Support/security_checker.sh
-
Verifique se todos os nós têm as alterações atualizadas (que devem corresponder ao resultado visto na etapa 2).
# isi_for_array -sX "grep security_checker /etc/crontab"
-
Confirme se todos os nós têm o mesmo MD5 para o
/etc/mcp/templates/crontab.# isi_for_array -sX "md5 /etc/mcp/templates/crontab"
Se o hash md5 for diferente para qualquer nó, copie o
/etc/mcp/templates/crontabarquivo para o qual você modificou/ifs/data/Isilon_Support. Faça log-in no nó com o valor md5 diferente e copie/ifs/data/Isilon_Support/crontabsobre o arquivo existente. Verifique se as permissões permanecem 640 (-rw-r-----) -
Colete o PID (Process ID, ID do processo) atual para
cron:# isi_for_array -sX "ps -auxww | grep cron | grep -v grep"
Exemplo:
LAB-1# isi_for_array -sX "ps -auxww | grep cron | grep -v grep" LAB-1: root 3140 0.0 0.0 25488 13016 - Is 6Oct24 0:14.15 /usr/sbin/cron -s LAB-2: root 3144 0.0 0.0 25488 13016 - Is 6Oct24 0:14.39 /usr/sbin/cron -s LAB-3: root 3173 0.0 0.0 25488 13016 - Is 6Oct24 0:14.14 /usr/sbin/cron -s
-
Reinicie
cronno cluster.# isi_for_array -sX "/etc/rc.d/cron restart"
Exemplo:
LAB-1# isi_for_array -sX "/etc/rc.d/cron restart" LAB-1: Stopping cron. LAB-1: Waiting for PIDS: 3140. LAB-1: Starting cron. LAB-2: Stopping cron. LAB-2: Waiting for PIDS: 3144. LAB-2: Starting cron. LAB-3: Stopping cron. LAB-3: Waiting for PIDS: 3173.
-
Se você receber
Exit status 1Em qualquer nó, reinicie ocronnesse nó. Coletar o PID atual paracrone confirme se o processo foi reiniciado em todos os nós seguindo as etapas descritas na etapa 5 (os PIDs deveriam ter sido alterados).