NetWorker: Errores rpc en dispositivos de respaldo DDBoost de NetWorker
摘要: Data Domain con sesión activa observa problemas de comunicación que hacen que los dispositivos Data Domain entren en un estado obsoleto. Incluso si no hay nada escribiendo, mantiene la sesión que no funciona y no liberará la información de sesión utilizada desde la base de datos de administración de medios. Todos los dispositivos asociados con el mismo pool y nodo de almacenamiento no pueden aceptar más sesiones; los dispositivos afectados no aceptan ningún trabajo de respaldo o clonación, lo que genera errores de RPC. ...
症状
- Todas las operaciones de respaldo/clonación en el servidor de NetWorker simplemente permanecerían en estado Suspendido/En cola, ya que los dispositivos DDBOOST estaban en estado Desmontado y se observaría el siguiente error en los registros de acciones:
- El respaldo del saveset falló debido a errores irrecuperables es uno de los mensajes de error significativos.
- Los dispositivos Data Domain se desmontan durante la ventana Backup, aunque no hay problemas de conectividad entre NetWorker y Data Domain.
- Daños en la base de datos de trabajos de NetWorker que provocan incoherencias entre la aplicación de respaldo de NetWorker y la base de datos de trabajos
原因
解决方案
Los valores de tiempo de espera agotado en los nodos de almacenamiento de NetWorker deben ajustarse según las consideraciones del ambiente de respaldo de NetWorker y la guía de optimización de dispositivos de NetWorker.
En un nodo de almacenamiento de NetWorker de Linux, siga los siguientes pasos para configurar los valores de tiempo de espera de mantenimiento activo de TCP adecuados, como se muestra.2. Ejecute los siguientes comandos para modificar la configuración de tcp_keepalive:
# echo 700 > /proc/sys/net/ipv4/tcp_keepalive_time
# echo 10 > /proc/sys/net/ipv4/tcp_keepalive_intvl
# echo 20 > /proc/sys/net/ipv4/tcp_keepalive_probes
2. Vaya a " HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\Tcpip\Parameters ".
3. Cree una nueva entrada REG-DWORD denominada " KeepAliveTime ".
4. Dele un valor de Decimal 900000 (15 minutos).
5. Se requiere un reinicio para activar el nuevo valor.
NOTA: El ajuste de TCP adicional se detalla en la Guía de planificación de la optimización del rendimiento de NetWorker, disponible a través de https://www.dell.com/support/home/product-support/product/networker/docs.
Los servicios de NetWorker del nodo de almacenamiento se deben reiniciar una vez que se definen los parámetros anteriores. Asegúrese de que estos valores permanezcan coherentes en todos los reinicios del nodo de almacenamiento de NetWorker.
Además, cualquier incoherencia en la aplicación de respaldo de NetWorker en relación con el proceso nsrmmd en el nodo de almacenamiento de NetWorker se debe eliminar mediante los pasos que se mencionan a continuación.
1. Detenga los servicios de NetWorker en el servidor de respaldo.
Linux: nsr_shutdown
Windows: net stop nsrexecd /y
2. Cambie el nombre de las carpetas /nsr/res/jobsdb, /nsr/logs/daemon.raw y /nsr/tmp en el servidor de NetWorker.
3. Reinicie los servicios de NetWorker nuevamente en el servidor de respaldo; esto ahora reinicializará las operaciones de guardado de NetWorker y no se observarán más valores de tiempo de espera agotado de inactividad y restablecimiento de la conexión RPC.
Linux: systemctl start networker
Windows: net start nsrd
si NMC está instalado en el servidor de NetWorker: net start gstd