NetWorker: Errores rpc en dispositivos de respaldo DDBoost de NetWorker

摘要: Data Domain con sesión activa observa problemas de comunicación que hacen que los dispositivos Data Domain entren en un estado obsoleto. Incluso si no hay nada escribiendo, mantiene la sesión que no funciona y no liberará la información de sesión utilizada desde la base de datos de administración de medios. Todos los dispositivos asociados con el mismo pool y nodo de almacenamiento no pueden aceptar más sesiones; los dispositivos afectados no aceptan ningún trabajo de respaldo o clonación, lo que genera errores de RPC. ...

本文适用于 本文不适用于 本文并非针对某种特定的产品。 本文并非包含所有产品版本。

症状

  • Todas las operaciones de respaldo/clonación en el servidor de NetWorker simplemente permanecerían en estado Suspendido/En cola, ya que los dispositivos DDBOOST estaban en estado Desmontado y se observaría el siguiente error en los registros de acciones: 
No se pudo obtener el nombre de usuario y la contraseña del dispositivo ; La operación de envío de RPC falló; errno = tubería rota
 
  • El respaldo del saveset falló debido a errores irrecuperables es uno de los mensajes de error significativos.
  • Los dispositivos Data Domain se desmontan durante la ventana Backup, aunque no hay problemas de conectividad entre NetWorker y Data Domain.
  • Daños en la base de datos de trabajos de NetWorker que provocan incoherencias entre la aplicación de respaldo de NetWorker y la base de datos de trabajos

原因

Los errores rpc en los dispositivos de respaldo DDBOOST de Data Domain se deben monitorear periódicamente y se deben tomar medidas correctivas; de lo contrario, los trabajos de respaldo/clonación solo permanecen en estado de espera e incluso no hay nada que lo escriba, contiene la sesión que no funciona y no liberará la información de la sesión utilizada desde la base de datos de administración de medios.

解决方案

El reinicio de los servicios de NetWorker se puede realizar en la primera instancia y podemos observar que el problema se produce nuevamente, ya que los errores de RPC subyacentes en los dispositivos DDBOOST aún persisten. 

Los valores de tiempo de espera agotado en los nodos de almacenamiento de NetWorker deben ajustarse según las consideraciones del ambiente de respaldo de NetWorker y la guía de optimización de dispositivos de NetWorker.

En un nodo de almacenamiento de NetWorker de Linux, siga los siguientes pasos para configurar los valores de tiempo de espera de mantenimiento activo de TCP adecuados, como se muestra.
1. Cambie a root: sudo su -
2. Ejecute los siguientes comandos para modificar la configuración de tcp_keepalive:
# echo 700 > /proc/sys/net/ipv4/tcp_keepalive_time
# echo 10 > /proc/sys/net/ipv4/tcp_keepalive_intvl
# echo 20 > /proc/sys/net/ipv4/tcp_keepalive_probes
En un nodo de almacenamiento de Windows Networker, siga los pasos que se indican a continuación para establecer los valores de tiempo de espera de keep alive de TCP adecuados, como se muestra a continuación:
1. Respalde el registro de Windows antes de realizar cambios.
2. Vaya a " HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\Tcpip\Parameters ".
3. Cree una nueva entrada REG-DWORD denominada " KeepAliveTime ".
4. Dele un valor de Decimal 900000 (15 minutos).
5. Se requiere un reinicio para activar el nuevo valor.

NOTA: El ajuste de TCP adicional se detalla en la Guía de planificación de la optimización del rendimiento de NetWorker, disponible a través de https://www.dell.com/support/home/product-support/product/networker/docs.

Los servicios de NetWorker del nodo de almacenamiento se deben reiniciar una vez que se definen los parámetros anteriores. Asegúrese de que estos valores permanezcan coherentes en todos los reinicios del nodo de almacenamiento de NetWorker.

Además, cualquier incoherencia en la aplicación de respaldo de NetWorker en relación con el proceso nsrmmd en el nodo de almacenamiento de NetWorker se debe eliminar mediante los pasos que se mencionan a continuación.

1. Detenga los servicios de NetWorker en el servidor de respaldo.

Linux: nsr_shutdown
Windows: net stop nsrexecd /y

2. Cambie el nombre de las carpetas /nsr/res/jobsdb, /nsr/logs/daemon.raw y /nsr/tmp en el servidor de NetWorker.
3. Reinicie los servicios de NetWorker nuevamente en el servidor de respaldo; esto ahora reinicializará las operaciones de guardado de NetWorker y no se observarán más valores de tiempo de espera agotado de inactividad y restablecimiento de la conexión RPC.

Linux: systemctl start networker
Windows: net start nsrd

si NMC está instalado en el servidor de NetWorker: net start gstd

文章属性
文章编号: 000217738
文章类型: Solution
上次修改时间: 15 11月 2023
版本:  2
从其他戴尔用户那里查找问题的答案
支持服务
检查您的设备是否在支持服务涵盖的范围内。