NetWorker: Erros de RPC em dispositivos de backup do NetWorker DDBoost
摘要: O Data Domain com sessão ativa observa problemas de comunicação que fazem com que os dispositivos Data Domain insiram um estado obsoleto. Mesmo que não haja nada escrito, ele mantém a sessão que não está funcionando e não liberará as informações da sessão usadas do banco de dados de gerenciamento de mídia. Todos os dispositivos associados ao mesmo pool e ao mesmo nó de armazenamento não conseguem aceitar mais nenhuma sessão; nenhum trabalho de backup ou clone é aceito pelos dispositivos afetados, resultando em erros de RPC. ...
症状
- Todas as operações de backup/clonagem no servidor do NetWorker permaneceriam no status Hung/Queued, pois os dispositivos DDBOOST estavam no status Unmounted e o seguinte erro seria visto nos registros de ação:
- O backup do saveset apresentou falha devido a erros irrecuperáveis é uma das mensagens de erro significativas.
- Os dispositivos Data Domain são desmontados durante a janela Backup, embora não haja problemas de conectividade entre o NetWorker e o Data Domain.
- Corrupção no banco de dados de trabalhos do NetWorker, o que leva à inconsistência entre o aplicativo de backup do NetWorker e o banco de dados de trabalhos
原因
解决方案
Time out Os valores nos nós de armazenamento do NetWorker devem ser ajustados de acordo com as considerações sobre o ambiente de backup do NetWorker e o guia de otimização de dispositivos do NetWorker.
Em um nó de armazenamento do Linux Networker, siga o abaixo para definir os valores adequados de tempo limite de TCP Keep Alive, conforme mostrado.2. Execute os seguintes comandos para modificar tcp_keepalive configurações:
# echo 700 > /proc/sys/net/ipv4/tcp_keepalive_time
# echo 10 > /proc/sys/net/ipv4/tcp_keepalive_intvl
# echo 20 > /proc/sys/net/ipv4/tcp_keepalive_probes
2. Navegue até " HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\Tcpip\Parameters ".
3. Crie uma nova entrada REG-DWORD chamada " KeepAliveTime ".
4. Atribua a ele um valor decimal 900000 (15 minutos).
5. Uma reinicialização é necessária para tornar o novo valor ativo.
Nota: O ajuste adicional do TCP é detalhado no Guia de Planejamento de Otimização de Desempenho do NetWorker, disponível por meio https://www.dell.com/support/home/product-support/product/networker/docs.
Os serviços do NetWorker do nó de armazenamento devem ser reiniciados assim que os parâmetros acima forem definidos. Certifique-se de que esses valores permaneçam consistentes nas reinicializações do nó de armazenamento do NetWorker.
Além disso, qualquer inconsistência no aplicativo de backup do NetWorker em relação ao processo nsrmmd no nó de armazenamento do NetWorker precisa ser eliminada executando as etapas mencionadas abaixo.
1. Interrompa os serviços do NetWorker no servidor de backup.
Linux: nsr_shutdown
Windows: net stop nsrexecd /y
2. Renomeie as pastas /nsr/res/jobsdb, /nsr/logs/daemon.raw e /nsr/tmp no servidor do NetWorker.
3. Reinicie os serviços do NetWorker novamente no servidor de backup. Isso reinicializará as operações de salvamento do NetWorker e não serão observados valores adicionais de redefinição de conexão RPC e timeout de inatividade.
Linux: systemctl start networker
Windows: net start nsrd
se o NMC estiver instalado no servidor do NetWorker: net start gstd