PowerScale: Isilon: Relatórios de auditoria STATUS_TIMEOUT erros

Summary: Se você receber STATUS_TIMEOUT eventos no CELOG alertando de um ou mais servidores CEE, este KB foi projetado para ajudar a entender os eventos e ajudar a identificar a causa.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

O Isilon CEE informará um erro de STATUS_TIMEOUT se receber uma resposta de uma solicitação de heartbeat fora de uma janela de 3 segundos.  Este é um teste de conectividade entre o cluster do Isilon e o servidor CEE.  Os atrasos para a resposta podem ser causados por muitas causas possíveis, aqui discutiremos algumas que vimos. 
 
1. Servidor CEE com excesso de energia que causa falta de recursos no servidor CEE
  • pode causar um atraso no processamento da resposta ou estar sobrecarregando o servidor CEE não permitindo que ele forneça uma resposta no período de tempo correto. 
2. A pesquisa de DNS demora muito
  •  faz com que o fluxo completo de pacotes TCP dure muito tempo
3. Atrasos de rede

Additional Information

Este conteúdo está traduzido 14 idiomas: 
https://downloads.dell.com/TranslatedPDF/ES_KB540170.pdf
https://downloads.dell.com/TranslatedPDF/ES-XL_KB540170.pdf
https://downloads.dell.com/TranslatedPDF/FR_KB540170.pdf
https://downloads.dell.com/TranslatedPDF/IT_KB540170.pdf
https://downloads.dell.com/TranslatedPDF/JA_KB540170.pdf
https://downloads.dell.com/TranslatedPDF/KO_KB540170.pdf
https://downloads.dell.com/TranslatedPDF/NL_KB540170.pdf
https://downloads.dell.com/TranslatedPDF/PT_KB540170.pdf
https://downloads.dell.com/TranslatedPDF/PT-BR_KB540170.pdf
https://downloads.dell.com/TranslatedPDF/RU_KB540170.pdf
https://downloads.dell.com/TranslatedPDF/ZH-CN_KB540170.pdf
https://downloads.dell.com/TranslatedPDF/ZH-TW_KB540170.pdf
https://downloads.dell.com/TranslatedPDF/AR_KB540170.pdf
https://downloads.dell.com/TranslatedPDF/DE_KB540170.pdf


Para analisar o servidor Overdriven CEE, podemos examinar o Gerenciador de tarefas nesse servidor e ver como são a CPU, a memória e o throughput de rede.  Se virmos qualquer um desses acima de 90%, talvez queiramos considerar a adição de mais servidores CEE para distribuir a carga de auditoria ou aumentar os recursos permitidos pelo servidor CEE.  Os guias de administração informam que você mantenha uma proporção de 1:1 de servidores CEE para nós de auditoria. 

Também queremos analisar o backlog atual de auditoria e a taxa de exportação atual usando os dois comandos abaixo:
# isi_for_array -sX 'isi_audit_progress -t protocol CEE_FWD'
# isi statistics query current --nodes=all --keys=node.audit.cee.export.rate

To avoid DNS lookup issues I advise to configure your CEE servers by IP instead of DNS name.  This eliminates DNS lookup and allows faster (marginally) audit performance with or without seeing the STATUS_TIMEOUT events.  


Network Delays can come up from many issues in the network configuration, a CEE server off site or on a different network with many hops can cause these requests to take longer than 3 seconds to complete. 
Article Properties
Article Number: 000158349
Article Type: How To
Last Modified: 28 Oct 2022
Version:  3
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.