NetWorker: O servidor do NetWorker em cluster do Red Hat 8.x falha ao iniciar após a atualização do pacemaker
Summary: O servidor do NetWorker implementado em um cluster de failover Red Hat 8.x não inicia com "Não é possível iniciar nsrd porque /nsr/res (/nsr) é local e o NetWorker está configurado como um servidor de cluster". ...
Symptoms
- A configuração do servidor do NetWorker é implementada em um cluster de alta disponibilidade do Red Hat 8.x.
- A coluna
nwsFalha ao iniciar o recurso:
[root@NetWorker_Node_Name ~]# pcs status
...
Full List of Resources:
* Resource Group: NW_group:
* fs (ocf::heartbeat:Filesystem): Started NetWorker_Node_Name
* ip (ocf::heartbeat:IPaddr): Started NetWorker_Node_Name
* nws (ocf::EMC_NetWorker:Server): FAILED NetWorker_Node_Name
Failed Resource Actions:
* nws_start_0 on NetWorker_Node_Name 'error' (1): call=25, status='Timed Out', exitreason='Resource agent did not complete within 5m', last-rc-change='DDD MM # HH:MM:SS 2022', queued=0ms, exec=300011ms
- Falha ao iniciar os serviços do servidor do NetWorker, com o seguinte registro no daemon.raw do diretório nsr compartilhado:
- Exemplo:
nsr_render_log /nsr_share/nsr/logs/daemon.raw
- Exemplo:
73248 MM/DD/YY HH:MM:SS AM/PM 5 5 0 1783289664 29561 0 NetWorker_Node_Name nsrd NSR critical Can't start nsrd because /nsr/res (/nsr) is local, and NetWorker is configured as a cluster server. Use cluster manager to check NetWorker service status.
144354 MM/DD/YY HH:MM:SS AM/PM 1 5 0 3720415040 28971 0 NetWorker_Node_Name nsrctld NSR notice Daemon nsrdispd terminated.
144359 MM/DD/YY HH:MM:SS AM/PM 3 5 0 3720415040 28971 0 NetWorker_Node_Name nsrctld NSR error Scheduling restart of daemon nsrdispd in 5 seconds
137911 MM/DD/YY HH:MM:SS AM/PM 5 5 0 3720415040 28971 0 NetWorker_Node_Name nsrctld NSR critical Aborting startup sequence: Process nsrd exited in less than 10 seconds at startup: exit code 1
127108 MM/DD/YY HH:MM:SS AM/PM 5 5 0 3720415040 28971 0 NetWorker_Node_Name nsrctld NSR critical Failed to start all daemons; shutting down...
lcmapnão mostra o endereço IP em cluster ou os caminhos de propriedade:
[root@NetWorker_Node_Name ~]# lcmap
type: NSR_CLU_TYPE;
clu_type: NSR_LC_TYPE;
interface version: 1.0;
[root@NetWorker_Node_Name ~]#
- O servidor do NetWorker deve ter a versão 19.8.0.1 ou mais antiga.
Cause
Esse problema foi encontrado ao usar pcs Versão 0.10.14 (ou mais recente). lcmap Não mapeia corretamente o local compartilhado.
[root@NetWorker_Node_Name ~]# pcs --version
0.10.14Resolution
Solução:
Esse problema foi resolvido no NetWorker 19.8.0.4; no entanto, o 19.8 é o fim da vida útil de suporte (EOSL) em 11 de novembro de 2025. Faça upgrade para a versão 19.9.0.2 ou posterior para uma correção de código: https://www.dell.com/support/home/product-support/product/networker/drivers
Solução temporária:
-
Certifique-se de que o sistema operacional atenda aos requisitos de suporte da versão do NetWorker em uso https://elabnavigator.dell.com/eln/modernHomeAutomatedTiles?page=NetWorker
downgradepcsda versão para 0.10.12.
yum downgrade pcs
pcs quando uma versão mais recente é encontrada. Isso pode ser bloqueado até que a correção de código esteja disponível, excluindo-se pcs no yum.conf. Remova esta entrada do yum.conf depois que o NetWorker recebe upgrade para uma das versões listadas acima (ou posterior).
root@NWrhelNodeA:~# echo exclude=pcs >> /etc/yum.conf root@NWrhelNodeA:~# cat /etc/yum.conf | grep pcs exclude=pcs
Uma vez em 0.10.12 lcmap vê os caminhos de propriedade corretamente e nws O recurso é iniciado:
[root@NetWorker_Node_Name ~]# pcs --version 0.10.12 [root@NetWorker_Node_Name ~]# lcmap type: NSR_CLU_TYPE; clu_type: NSR_LC_TYPE; interface version: 1.0; type: NSR_CLU_VIRTHOST; hostname: Cluster_IP; local: TRUE; owned paths: /nsr_share; [root@NetWorker_Node_Name ~]# pcs resource status * Resource Group: NW_group: * fs (ocf::heartbeat:Filesystem): Started NetWorker_Node_Name * ip (ocf::heartbeat:IPaddr): Started NetWorker_Node_Name * nws (ocf::EMC_NetWorker:Server): Started NetWorker_Node_Name