Guia de solução de problemas do NetWorker: Falhas de processo e core dumps
Resumo: Guia abrangente do Dell NetWorker para solução de problemas de falhas de processo e dumps de núcleo
Sintomas
Guia de solução de problemas do NetWorker: Falhas de processo e core dumps
Vídeo: Guia abrangente do Dell NetWorker para solução de problemas de falhas de processo e dumps de núcleo
Assista no YouTube
Causa
Resolução
Nota: Antes de solucionar problemas e diagnosticar um core dump em seu sistema, pesquise no site do Suporte Dell artigos específicos ao processo em que o core dumped. Em alguns cenários, há uma correção conhecida publicada. Se nenhuma correção for identificada, siga as etapas descritas neste artigo. Cada etapa fornece instruções ou um link para um documento a fim de eliminar possíveis causas e tomar ações corretivas conforme necessário. As etapas são ordenadas na sequência mais apropriada para isolar o problema e identificar a resolução adequada. Não pule uma etapa.
Etapa 1: Coletando informações - Descrição do problema:
- Em que circunstâncias o processo falha? Esse comportamento é consistente?
- Isso funcionava melhor antes?
- Tempos de ocorrências e tendência de comportamento observado?
- O problema acontece somente em momentos de carga pesada no ambiente de backup ou backups ou em um tipo específico de grupo de backup?
- Quando o problema ocorreu pela primeira vez? O que mudou então?
- Qual é o escopo do problema (todos os clients/alguns clients, todos os destinos de backup ou alguns)
- O que se tentou até agora corrigir e que conclusões foram tiradas a partir disso.
Etapa 2: Coleta de informações - Ambiente
Qual processo do NetWorker não está respondendo e em qual máquina (servidor, nó de armazenamento ou client).
- Versão e plataforma do servidor do NetWorker: NetWorker: Métodos para identificar a versão do software NetWorker
- Visão geral do tamanho e da natureza da zona de dados de backup
- Mídia de destino para esses backups
Etapa 3: Suporte
- Usando o Guia de compatibilidade on-line do NetWorker (requer login na conta de Suporte Dell), verifique se todos os componentes (servidor NetWorker, versão do file system, proxy, nós de armazenamento, clients, destino) são compatíveis.
- Verifique se não há nenhuma deficiência subjacente de hardware ou sistema operacional que possa explicar as falhas do processo (falhas de disco, disco cheio, erros de rede e assim por diante).
Etapa 4: Práticas recomendadas
O Guia de planejamento de otimização de desempenho do NetWorker lista os requisitos de software e hardware que dão suporte a um ambiente do NetWorker otimizado. Isso deve ser revisto para garantir que as práticas recomendadas estejam sendo seguidas. Isso é relevante se o processo que está sem resposta estiver acontecendo em momentos de carga mais pesada. A documentação do NetWorker está disponível por meio de: Suporte para o NetWorker | Drivers e downloads
Etapa 5: Isolamento de componentes:
Como vamos encontrar a causa raiz do problema de processo não responder depende do comportamento definido na Etapa 1. Se o gatilho for desconhecido, testes podem ser realizados para tentar estabelecer o que está causando a falha:
- Monitore o desempenho do sistema sob carga pesada
- Examine os arquivos de log do sistema operacional na época das falhas para ver se há semelhança no comportamento.
- Linux:
/var/log/messages - Windows: Registros de eventos do sistema e do aplicativo
- Linux:
- Analise os registros do NetWorker para ver quais operações estão ocorrendo quando os dumps de núcleo ocorrem e quando:
- Linux:
/nsr/logs/daemon.raw - Windows (padrão):
C:\Program Files\EMC NetWorker\nsr\logs\daemon.raw - NetWorker: Como usar nsr_render_log para processar arquivos de log .raw
- Os processos específicos de host do NetWorker são definidos em: Processos e portas do NetWorker
- Linux:
- Descubra quais operações não pertencentes ao NetWorker são executadas nessa máquina que podem afetar seu comportamento e se sua programação está correlacionada com os tempos de falhas.
- Se a falha ocorrer de forma consistente, altere alguns parâmetros para tentar restringir a causa. Por exemplo, fazer backup em uma mídia de destino diferente ou fazer backup de diferentes tipos de dados a partir do mesmo client do NetWorker
Etapa 6: Resolução
Um core dump é um arquivo que captura a memória de trabalho de um processo em um momento específico, geralmente quando o programa é encerrado de forma anormal. Um core dump ajuda a identificar por que um processo deixa de responder, revelando as funções em execução e os dados em uso no momento da falha.
- Verifique a coluna
/nsr/corespara dumps de núcleo recentes de processos do NetWorker no UNIX ou Linux ou verifique o diretório de falha conforme definido no registro do Windows (consulte a etapa 2). - Se não houver nenhum, verifique se o sistema operacional está configurado para gerar arquivos core dump se houver uma falha no processo. Consulte a documentação do sistema operacional para obter detalhes completos, mas, em resumo, isso envolve alterações
ulimit -ce-fno UNIX e Linux, e fazer uma alteração de registro no Windows. - Ferramentas do sistema operacional, como
gdb(UNIX e Linux) eWinDbg(Windows) pode ser usado para avaliar o core dump. Consulte a documentação do fornecedor do SO sobre essas funções. - Para obter informações sobre suporte do NetWorker, consulte: NetWorker: Como usar o pkgcore para gerar pacotes de dump do núcleo
Mais informações
Ao envolver o suporte do NetWorker em casos relacionados a core dump, as informações coletadas neste artigo devem ser fornecidas. Um pacote NSRGET e o core dump pkgcore pacotes também devem ser fornecidos.