NetWorker: La clonación habilitada para RPS falla después de la actualización a 19.11 si el servidor tiene el estado de DNS inverso establecido en prohibido
Summary: En este artículo, se describe un fallo que está investigando el equipo de ingeniería de NetWorker.
Symptoms
Después de actualizar a NetWorker 19.11, los trabajos de clonación parecen no responder y registran el siguiente bucle de mensajes:
01/13/25 16:51:19.000291 nsrclone-D5 find_clone_backend_job(): ENTER 01/13/25 16:51:19.000323 nsrclone-D5 extend_mmd_reservation_all_clone_backend_jobs: ENTER 01/13/25 16:51:19.000335 nsrclone-D5 extend_mmd_reservation_all_clone_backend_jobs: EXIT 01/13/25 16:51:20.001007 nsrclone-D5 extend_mmd_reservation_all_clone_backend_jobs: ENTER 01/13/25 16:51:20.001070 nsrclone-D5 extend_mmd_reservation_all_clone_backend_jobs: EXIT 01/13/25 16:51:21.000097 nsrrecopy-D3 main 0x342e850 wait timed out (locked)
El problema aparece cuando:
- El servidor tiene un estado de DNS inverso: prohibido establecido en la base de datos del agente local (nsrladb)
- El trabajo de clonación está configurado para usar un nodo de almacenamiento remoto en lugar del servidor como nodo de origen (lectura)
- El trabajo de clonación requiere RPS, ya sea que se configure globalmente en el recurso NSR (servidor) (deshabilite el clon de RPS: No) o se invoca automáticamente debido al tipo de saveset (vProxy/OAPP)
El trabajo no se completa y falla o se debe anular.
Cause
La causa parece estar relacionada con los cambios en las comunicaciones en NetWorker 19.11. El nuevo valor de estado de DNS inverso permite a los administradores eliminar los requisitos de coincidencia de búsqueda inversa, que han sido parte de NetWorker desde sus versiones iniciales.
Sin embargo, este importante cambio parece haber introducido problemas que están siendo investigados. A pesar de que el estado de DNS inverso no está "prohibido" de manera predeterminada, los administradores que lo utilizan en el servidor enfrentan problemas con la clonación de RPS cuando se utiliza un nodo de almacenamiento independiente.
Resolution
La corrección se está investigando en el error NETWORKER-111382. En el momento de la escritura, esta corrección no aparecerá hasta al menos NetWorker 19.11.0.5 o NetWorker 19.12.0.1.
A corto plazo, hay tres posibles soluciones alternativas para el problema:
- Use el estado de DNS inverso: almacenado en caché o sin almacenamiento en caché en lugar de prohibido en el servidor. Si actualmente depende de la configuración prohibida para que los respaldos de clientes que no se pueden resolver a la inversa tengan éxito, deberá asegurarse de que se creen entradas de zona de búsqueda inversa de DNS para las direcciones IP de esos clientes, consultables por el servidor NetWorker Server y los nodos, para que continúen funcionando. Para cambiar esta configuración en el servidor, en un símbolo del sistema con privilegios elevados, ejecute lo siguiente:
(echo . type: nsrla & echo upd reverse DNS state: cached) | nsradmin -p nsrexec -i -
printf ". type: nsrla\nupd reverse DNS state: cached\n" | nsradmin -p nsrexec -i -
A continuación, reinicie los servicios después del cambio:
nsr_shutdown systemctl start networker
net stop nsrexecd /y net start nsrd net start gstd *Starting gstd is only required if NMC server is installed on the same host as the NetWorker server.
- Cambie los nodos Source y Destination en la acción de clonación para usar el servidor (nsrserverhost) en lugar de un nodo de almacenamiento, si es posible. Para los trabajos de clonación de Data Domain, el nodo de almacenamiento es en gran medida irrelevante, ya que los propios Data Domain manejan el tráfico de datos y está supeditado únicamente al acceso del servidor a cada Data Domain.
- Deshabilite RPS globalmente. Advertencia: Esto no ayudará con los tipos de saveset que requieren RPS y lo invocan automáticamente como parte de la operación de clonación, como los savesets vProxy y OAPP. Si no va a clonar estos tipos de savesets, requiere que se prohíban las búsquedas inversas y no puede usar el servidor como nodo por algún motivo, esto proporciona una tercera opción, si es la menos ideal (debido a que se prefiere RPS cuando es posible). Para ello, en el servidor, en un símbolo del sistema con privilegios elevados, ejecute lo siguiente:
(echo . type: nsr & echo upd Disable RPS Clone: Yes) | nsradmin -i -
printf ". type: nsrla\nupd Disable RPS Clone: Yes\n" | nsradmin -i -
No se requiere un reinicio del servicio: el siguiente trabajo de clonación debe comenzar con RPS deshabilitado.
Additional Information
Para problemas similares con NetWorker 19.11 relacionados con fallas de respaldo relacionadas con la nueva configuración de estado de DNS inverso , consulte: NetWorker: Después de actualizar a la versión 19.11, el respaldo falla e informa "Falló la resolución del nombre de host"