NetWorker: Po aktualizaci kardiostimulátoru se nedaří spustit clusterovaný server NetWorker Red Hat 8.x
Summary: Server NetWorker nasazený v clusteru s podporou převzetí služeb při selhání Red Hat 8.x se nespustí s chybou "Can't start nsrd, because /nsr/res (/nsr) is local and NetWorker is is configured as a cluster server." ...
Symptoms
- Konfigurace serveru NetWorker je nasazena v clusteru Red Hat 8.x s vysokou dostupností.
- Skript
nwsZdroj se nespustí:
[root@NetWorker_Node_Name ~]# pcs status
...
Full List of Resources:
* Resource Group: NW_group:
* fs (ocf::heartbeat:Filesystem): Started NetWorker_Node_Name
* ip (ocf::heartbeat:IPaddr): Started NetWorker_Node_Name
* nws (ocf::EMC_NetWorker:Server): FAILED NetWorker_Node_Name
Failed Resource Actions:
* nws_start_0 on NetWorker_Node_Name 'error' (1): call=25, status='Timed Out', exitreason='Resource agent did not complete within 5m', last-rc-change='DDD MM # HH:MM:SS 2022', queued=0ms, exec=300011ms
- Služby serveru NetWorker se nespustí, v daemon.raw sdíleného adresáře nsr je zaznamenán následující údaj:
- Příklad:
nsr_render_log /nsr_share/nsr/logs/daemon.raw
- Příklad:
73248 MM/DD/YY HH:MM:SS AM/PM 5 5 0 1783289664 29561 0 NetWorker_Node_Name nsrd NSR critical Can't start nsrd because /nsr/res (/nsr) is local, and NetWorker is configured as a cluster server. Use cluster manager to check NetWorker service status.
144354 MM/DD/YY HH:MM:SS AM/PM 1 5 0 3720415040 28971 0 NetWorker_Node_Name nsrctld NSR notice Daemon nsrdispd terminated.
144359 MM/DD/YY HH:MM:SS AM/PM 3 5 0 3720415040 28971 0 NetWorker_Node_Name nsrctld NSR error Scheduling restart of daemon nsrdispd in 5 seconds
137911 MM/DD/YY HH:MM:SS AM/PM 5 5 0 3720415040 28971 0 NetWorker_Node_Name nsrctld NSR critical Aborting startup sequence: Process nsrd exited in less than 10 seconds at startup: exit code 1
127108 MM/DD/YY HH:MM:SS AM/PM 5 5 0 3720415040 28971 0 NetWorker_Node_Name nsrctld NSR critical Failed to start all daemons; shutting down...
lcmapnezobrazuje clusterovanou IP adresu ani vlastněné cesty:
[root@NetWorker_Node_Name ~]# lcmap
type: NSR_CLU_TYPE;
clu_type: NSR_LC_TYPE;
interface version: 1.0;
[root@NetWorker_Node_Name ~]#
- Server NetWorker je 19.8.0.1 nebo starší.
Cause
Tento problém byl zjištěn při použití pcs verze 0.10.14 (nebo novější). lcmap Nemapuje správně sdílené umístění.
[root@NetWorker_Node_Name ~]# pcs --version
0.10.14Resolution
Řešení:
Tento problém byl vyřešen v platformě NetWorker 19.8.0.4. Verze 19.8 však představuje konec životnosti podpory (EOSL) k 11. listopadu 2025. Upgrade na verzi 19.9.0.2 nebo novější pro opravu kódu: https://www.dell.com/support/home/product-support/product/networker/drivers
Viz: NetWorker: Cluster Red Hat Pacemaker: Jak upgradovat server NetWorker a vzorové postupy
Zástupné řešení:
-
Zajištění, že operační systém splňuje požadavky na podporu používané verze nástroje NetWorker https://elabnavigator.dell.com/eln/modernHomeAutomatedTiles?page=NetWorker
downgrade.pcsOd verze do verze 0.10.12.
yum downgrade pcs
pcs , když je nalezena novější verze. To lze zablokovat, dokud nebude k dispozici oprava kódu, vyloučením pcs V dialogovém okně yum.conf. Odebrat tuto položku z yum.conf po upgradu platformy NetWorker na jednu z výše uvedených verzí (nebo novější).
root@NWrhelNodeA:~# echo exclude=pcs >> /etc/yum.conf root@NWrhelNodeA:~# cat /etc/yum.conf | grep pcs exclude=pcs
Jednou na 0.10.12 lcmap vidí správně vlastněné cesty a nws Zdroj se spustí:
[root@NetWorker_Node_Name ~]# pcs --version 0.10.12 [root@NetWorker_Node_Name ~]# lcmap type: NSR_CLU_TYPE; clu_type: NSR_LC_TYPE; interface version: 1.0; type: NSR_CLU_VIRTHOST; hostname: Cluster_IP; local: TRUE; owned paths: /nsr_share; [root@NetWorker_Node_Name ~]# pcs resource status * Resource Group: NW_group: * fs (ocf::heartbeat:Filesystem): Started NetWorker_Node_Name * ip (ocf::heartbeat:IPaddr): Started NetWorker_Node_Name * nws (ocf::EMC_NetWorker:Server): Started NetWorker_Node_Name