NMDA: Los respaldos de DB2 fallan aleatoriamente cada noche con Error 3

Resumen: Los respaldos de DB2 de NMDA fallaron anoche con el error 3. El problema se resolvió después de crear un nuevo dispositivo, dispersar los respaldos en dos nodos de almacenamiento y configurar los parámetros de tiempo de espera y reintento de DB2. ...

Este artículo se aplica a Este artículo no se aplica a Este artículo no está vinculado a ningún producto específico. No se identifican todas las versiones del producto en este artículo.

Síntomas

El respaldo de DB2 de NMDA falla con Error 3
El respaldo de DB2 falla con el error 'lgto_auth for `nsrmmd' failed: busy"
No se encontraron problemas de red o firewall.

Hay 1000 de los siguientes mensajes en /nsr/logs/daemon.raw En el nodo de almacenamiento:

  • "5004-nfs lookup failed (nfs: No such file or directory)"
  • "invalid save stream"
  • "Cannot stat active file"
  • "unable to collect deduplication statistics"
  • "was aborted and removed from volume"
     

Error en nmda-messages.log libnsrdb2.log con debug=9:

153929 2/9/2021 10:34:50 PM  4 7 987 1 18153790 0 (client) (pid18153790) NSR severe The backup session could not start: busy. 
93412 2/9/2021 10:34:50 PM  3 5 0 1 18153790 0 (client) (pid18153790) NSR error Could not perform the action 2. The status was changed to 3. 
153929 1612842069 4 7 987 1 19136950 0 (client) (pid19136950) NSR severe 39 The backup session could not start: %s. 1 49 8 0 4 busy
93412 1612842069 3 5 0 1 19136950 0 (client)  (pid19136950) NSR error 62 Could not perform the action %d. The status was changed to %d. 2 1 1 2 1 1 3
(pid = 18809144) (02/09/21 21:40:00.338942) nsrdb2sv_log_program_args: /usr/bin/nsrdasv -LL -T db2 -s (NW server) -g (group)  -a *policy action jobid=2297950 -a *policy name=(policy)  -a *policy workflow name=(workflow)  -a *policy action name=(action)  -y Tue Feb 23 23:59:59 GMT-0600 2021 -w Tue Feb 23 23:59:59 GMT-0600 2021 -m (client) -a *policy action jobid restart=Yes -b (pool) -t 1612810625 -o ....

(pid = 18809144) (02/09/21 21:40:00.624767) Backing up the (DB) database.
(pid = 18809144) (02/09/21 21:40:00.624939) set_db2_version: Exiting set_db2_version(): Return code: 10050000
(pid = 18809144) (02/09/21 21:49:08.731480) DbBackup: Exiting with error:
Unable to backup DB2MDME database due to backup request failure, SQLCODE : -2025, SQL2025N  An I/O error occurred.  Error code: "3". Media on which this error occurred: "VENDOR".
 .
(pid = 18809144) (02/09/21 21:49:08.731631) libdb2sv_main: ERROR: DbBackup() failed.
(pid = 18809144) (02/09/21 21:49:08.731685) Unable to backup DB2MDME database due to backup request failure, SQLCODE : -2025, SQL2025N  An I/O error occurred.  Error code: "3". Media on which this error occurred: "VENDOR".

El error crítico es nsrmmd Error de ocupado a continuación:

02/09/21 21:32:46 (pid 18153790): 02/09/21 21:32:46.797073 lgto_auth for `nsrd' succeeded
02/09/21 21:32:46 (pid 18153790): 02/09/21 21:32:46.855631 lgto_parms for `nsrmmd' succeeded
02/09/21 21:32:46 (pid 18153790): 02/09/21 21:32:46.855705 got `store index entries' value of `Yes'
02/09/21 21:32:46 (pid 18153790): 02/09/21 21:32:46.855803 Saving in pool 'IDC-DB2'.
02/09/21 21:32:46 (pid 18153790): 02/09/21 21:32:46.855822 server enabled for immediate mode
02/09/21 21:32:46 (pid 18153790): 02/09/21 21:32:46.882267 lgto_auth for `nsrmmd' failed: busy
02/09/21 21:32:46 (pid 18153790): 02/09/21 21:32:46.882349 Unable to acquire the user credentials for direct save nsrmmd authentication: busy.
02/09/21 21:32:46 (pid 18153790): 02/09/21 21:32:46.882439 The error TYPE is 0, SEVERITY is 0, NUMBER is -13, errnum is -13, errstr is 'busy'.

Causa

Problemas de configuración/disponibilidad de recursos.

Resolución

El problema se resolvió después de realizar los cambios que se indican a continuación. No hay una sola causa raíz, pero la creación de un nuevo dispositivo y la configuración de los siguientes parámetros fueron de gran ayuda:

1. Se agregó un dispositivo nuevo al nodo de almacenamiento.
2. Respaldos distribuidos de manera uniforme en todos los nodos de almacenamiento (sesión de destino).
3. Se cambiaron las horas de inicio del respaldo.
4. Se agregaron estos parámetros en la información de la aplicación de DB2 de NMDA:

NSR_MAX_START_RETRIES=50
NSR_FXBUSY_RETRIES=10
NSR_MMDB_RETRY_TIME=10

5. Aumento del tiempo de espera de inactividad a 300, Reintentos=2, Retraso de reintento=10 en las propiedades de la acción de respaldo.

Productos afectados

NetWorker, NetWorker Module for Databases and Applications

Productos

NetWorker Family
Propiedades del artículo
Número del artículo: 000183668
Tipo de artículo: Solution
Última modificación: 08 may 2026
Versión:  7
Encuentre respuestas a sus preguntas de otros usuarios de Dell
Servicios de soporte
Compruebe si el dispositivo está cubierto por los servicios de soporte.