NetWorker: Como solucionar problemas de resposta de serviço no NetWorker usando o utilitário nsrwatch
Summary: O utilitário nsrwatch permite a solução de problemas em que há sintomas indicando que os processos principais do NetWorker podem não estar respondendo.
Instructions
O pacote de instalação do servidor NetWorker fornece um utilitário de linha de comando conhecido como nsrwatch. O comando nsrwatch é usado para monitorar e operar servidores NetWorker. Ele também pode ser usado para solucionar problemas de processos do NetWorker que não respondem ou que consomem recursos do sistema inesperadamente. O uso do utilitário nsrwatch não é a primeira etapa na solução de problemas de resposta de serviço no NetWorker. Ele só deve ser usado depois que as causas mais prováveis de problemas relacionados ao serviço ou ao desempenho tiverem sido excluídas:
Verifique primeiro que:
- Todos os elementos da zona de dados do NetWorker são compatíveis.
- Consulte os guias de compatibilidade no elab Navigator: https://elabnavigator.dell.com/eln/modernHomeAutomatedTiles?page=NetWorker
- Consulte o Guia de otimização e desempenho específico da versão do NetWorker, disponível no site do Suporte Dell: https://www.dell.com/support/product-details/product/networker/overview
- Em ambientes onde os nós de armazenamento remotos do NetWorker são implementados. A versão do NetWorker do nó de armazenamento deve corresponder à versão do NetWorker do servidor NetWorker.
- Não há nenhum problema de espaço em disco no servidor do NetWorker.
- Linux:
df -Th
-
- Windows: Verifique o uso do espaço em disco no Explorador de Arquivos do Windows ou no Gerenciamento de Disco.
- Os recursos disponíveis no servidor do NetWorker (CPU, RAM etc.) não estão esgotados durante os horários de pico.
- Linux:
top
-
- Windows: Gerenciador de tarefas ou Perfmon
- NetWorker: Solução de problemas de alto uso de memória ou CPU por processo
- Windows: Gerenciador de tarefas ou Perfmon
- Não há erros significativos nos logs do sistema operacional
- Linux: /var/log/messages
- Windows: Visualizador de eventos (registros de eventos do aplicativo e do sistema )
- O problema está em todas as operações padrão do NetWorker e não é mais específico, por exemplo: Backups em um nó de armazenamento, somente operações de clonagem são afetadas e assim por diante.
- A geração de core dump foi habilitada no nível do sistema operacional no servidor do NetWorker, e não há processos de core dumping.
- Planejamento de otimização e desempenho do NetWorker:
-
- Há volumes de destino suficientes disponíveis para os backups do NetWorker.
- Há descritores de arquivo aberto suficientes definidos em um servidor NetWorker Linux. Consulte: Requisitos de parâmetro de kernel do NetWorker
- Configurações e parâmetros de otimização de desempenho foram aplicados.
- O servidor do NetWorker atende aos requisitos mínimos para uma zona de dados desse tamanho. Consulte: Componentes do sistema.
- Para uma zona de dados grande, o servidor do NMC está em uma máquina separada do servidor do NetWorker. Consulte: Requisitos de memória para o servidor NetWorker e o NetWorker Management Console
- Os intervalos de portas foram definidos corretamente de acordo com o Guia de configuração de segurança, https://www.dell.com/support/product-details/product/networker/docs
NSRWATCH Opções de linha de comando:
| Opção | Função |
| -c contagem | Número de core dumps a serem utilizados durante a detecção de um problema de resposta. (disponibilidade ou resposta do serviço ou processo) |
| -d delimitador | Delimitador opcional para saída bruta |
| -g dir | Gere um core dump junto com um rastreamento de pilha para o diretório especificado. |
| -i intervalo | Intervalo em segundos entre consultas do servidor |
| -k intervalo | Intervalo em segundos entre o registro de rastreamentos de pilha |
| -n contagem | Número máximo de core dumps a serem gerados |
| - p programa[:versão] | Nome do programa RPC com versão opcional; Por exemplo: nsrd, nsrjobd, nsrmmdbd, nsrmmd:405 |
| - S dir | (Somente Windows) Caminho para arquivos PDB (Banco de dados do programa) do símbolo |
| -t limiar | Limite em segundos antes que o nsrwatch reporte um problema de capacidade de resposta. |
| Limite -u | Limite em %CPU antes de o nsrwatch reportar alta utilização da CPU |
| -v | Inclua contexto adicional ao registrar rastreamentos de pilha. |
Sistema operacional Windows: Como usar o nsrwatch para solucionar um problema aparente de serviço ou processo do NetWorker:
- Instalar o Debugging Tools
for Windows no servidor do NetWorker
- Certifique-se de que o cdb.exe esteja na variável
PATH do Windows . Uma nova janela de prompt de comando deve ser aberta para que essa alteração tenha efeito. Não requer reinicialização.
- Os arquivos de símbolo (arquivos pdb) para sua versão do NetWorker devem estar disponíveis. O suporte do Dell NetWorker pode fornecer isso.
- Execute nsrwatch e deixe o running aguardando a condição do serviço ou do processo.
Por exemplo: E:\Symbols sendo o caminho onde os arquivos pdb são implementados.
C:\>nsrwatch -p nsrd -i 10 -t 10 -k 10 -S E:\Symbols > E:\Logs\nsrwatch.nsrd 2>&1 C:\>nsrwatch -p nsrexecd -i 10 -t 10 -k 10 -S E:\Symbols > E:\Logs\nsrwatch.nsrexecd 2>&1 C:\>nsrwatch -p nsrmmdbd -i 10 -t 10 -k 10 -S E:\Symbols > E:\Logs\nsrwatch.nsrmmdbd 2>&1 C:\>nsrwatch -p nsrjobd -i 10 -t 10 -k 10 -S E:\Symbols > E:\Logs\nsrwatch.nsrjobd 2>&1
Logs a serem coletados:
- Renderizado daemon.raw
- daemon.raw
- Saída nsrwatch para os daemons relevantes (conforme descrito acima).
- Registros de eventos do sistema e do aplicativo
Sistema operacional Linux: Como usar o nsrwatch para solucionar um problema aparente de serviço ou processo do NetWorker:
- Instale binários não removidos no lugar dos binários padrão para o processo que é de interesse: Geralmente nsrd, nsrjobd, nsrmmdbd e nsrexecd. Eles podem ser fornecidos pelo suporte do Dell NetWorker.
- Isso exige que o NetWorker seja desligado primeiro. Eles devem ter as permissões corretas.
- Execute nsrwatch e deixe a execução aguardando o problema do serviço ou do processo.
nsrwatch -p nsrd -i 30 -t 30 -k 30 > nsrd_out nsrwatch -p nsrexecd -i 30 -t 30 -k 30 > nsrexecd_out nsrwatch -p nsrjobd -i 30 -t 30 -k 30 > nsrjobd_out nsrwatch -p nsrmmdbd -i 30 -t 30 -k 30 > nsrmmdbd_out
Logs a serem coletados:
- Renderizado daemon.raw
- daemon.raw
- Saída nsrwatch para os daemons relevantes.
- Arquivo de mensagens do SO (/var/log/messages)
- Verifique o arquivo /var/log/messages e certifique-se de que o log cubra toda a janela nsrwatch . Se houver muita atividade no servidor, o log de mensagens poderá rolar. Outros /var/log/messages-date ou /var/log/messages# existem se o arquivo de log de mensagens tiver sido transferido. Analise cuidadosamente o registro de data e hora de quando esses arquivos foram criados. Se eles também cobrirem a sessão nsrwatch , pegue esses logs de mensagens adicionais também.
Additional Information
Processos e portas do NetWorker
NetWorker: Como depurar operações
de backupNetWorker: Arquivos de log e locais
Guia de solução de problemas do NetWorker: Falhas de processo e core dumps
NetWorker: Solução de problemas de alto uso de memória ou CPU por processo