Os backups do NMDA DB2 19.4.0.0 falham aleatoriamente todas as noites com o erro 3

Summary: Falha em vários backups do DB2 no NMDA 19.4.0.0 na noite passada com o erro 3. O problema foi resolvido após criar um novo dispositivo e espalhar backups em dois nós de armazenamento e configurar os parâmetros de repetição e tempo de espera excedido do DB2. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Client do NetWorker 19.4.0.0: AIX 7.2
NMDA 19.4.0.0, DB2 Server v11.1.4.4
Os backups do DB2 falham aleatoriamente todas as noites
O backup do DB2 NMDA falha com o erro 3
O backup do DB2 falha com o erro "lgto_auth para "nsrmmd" failed: busy'Não
são vistos

problemas de rede ou firewall Há 1000 das mensagens abaixo em daemon.raw no nó de armazenamento:
"Falha na pesquisa 5004-NFS (NFS: Nenhum arquivo ou diretório desse tipo)"
"Fluxo de salvamento inválido"
"Não é possível stat active file"
"Não é possível coletar estatísticas de desduplicação"
"" foi abortado e removido do volume"

Erro no nmda-messages.log libnsrdb2.log com debug=9:
153929 09/02/2021 22:34:50 PM 4 7 987 1 18153790 0 (client) (pid18153790) NSR grave Não foi possível iniciar a sessão de backup: ocupado.   <--- este é o tempo de EST, foi renderizado em meu laboratório
93412 09/02/2021 22:34:50 3 5 0 1 18153790 0 (client) (pid18153790) Erro NSR: Não foi possível realizar a ação 2. O status foi alterado para 3. 
153929 1612842069 4 7 987 1 19136950 0 (client) (pid19136950) NSR grave 39 Não foi possível iniciar a sessão de backup: %s. 1 49 8 0 4 ocupado <--- horário
GMT 93412 1612842069 3 5 0 1 19136950 0 (client) (pid19136950) NSR error 62 Não foi possível executar a ação %d. O status foi alterado para %d. 2 1 1 2 1 1 3
(pid = 18809144) (02/09/21 21:40:00.338942) nsrdb2sv_log_program_args: /usr/bin/nsrdasv -LL -T db2 -s (servidor NW) -g (group) -a *policy action jobid=2297950 -a *policy name=(policy) -a *policy workflow name=(workflow) -a *policy action name=(action) -y Tue Feb 23 23:59:59 GMT-0600 2021 -w Tue Feb 23 23:59:59 GMT-0600 2021 -m (client) -a *policy action jobid restart=Yes -b (pool) -t 1612810625 -o ....

(pid = 18809144) (02/09/21 21:40:00.624767) Fazendo backup do banco de dados (DB).
(pid = 18809144) (02/09/21 21:40:00.624939) set_db2_version: Saindo set_db2_version(): Código de retorno: 10050000
(pid = 18809144) (02/09/21 21:49:08.731480) DbBackup: Saindo com erro:
Não é possível fazer backup DB2MDME banco de dados devido a uma falha na solicitação de backup, SQLCODE: -2025, SQL2025N Ocorreu um erro de E/S.  Código de erro: "3". Mídia na qual esse erro ocorreu: "VENDEDOR".
 .
(pid = 18809144) (02/09/21 21:49:08.731631) libdb2sv_main: ERROR: Falha
no DbBackup().(pid = 18809144) (02/09/21 21:49:08.731685) Não é possível fazer backup DB2MDME banco de dados devido a uma falha na solicitação de backup, SQLCODE: -2025, SQL2025N Ocorreu um erro de E/S.  Código de erro: "3". Mídia na qual esse erro ocorreu: "VENDEDOR".

O erro crítico é nsrmmd busy error below:
02/09/21 21:32:46 (PID 18153790): 02/09/21 21:32:46.797073 lgto_auth para 'nsrd' sucedido
02/09/21 21:32:46 (pid 18153790): 02/09/21 21:32:46.855631 lgto_parms para 'nsrmmd' sucedido
02/09/21 21:32:46 (pid 18153790): 02/09/21 21:32:46.855705 got 'store index entries' value of 'Yes'
02/09/21 21:32:46 (pid 18153790): 02/09/21 21:32:46.855803 Salvando no pool 'IDC-DB2'.
02/09/21 21:32:46 (pid 18153790): 02/09/21 21:32:46.855822 Servidor ativado para o modo
imediato 02/09/21 21:32:46 (PID 18153790): 02/09/21 21:32:46.882267 lgto_auth para "nsrmmd" falhou: ocupado
02/09/21 21:32:46 (pid 18153790): 02/09/21 21:32:46.882349 Não foi possível adquirir as credenciais do usuário para a autenticação nsrmmd de salvamento direto: ocupado.
02/09/21 21:32:46 (pid 18153790): 02/09/21 21:32:46.882439 O erro TYPE é 0, SEVERITY é 0, NUMBER é -13, errnum é -13, errstr é 'busy'.

Cause

Problemas de configuração/disponibilidade de recursos.

Resolution

O problema foi resolvido após as alterações abaixo. Não existe uma causa raiz única, mas a criação de um novo dispositivo e a configuração dos parâmetros abaixo ajudaram muito:

1. Adicionado 1 novo dispositivo em SN03
2. Backups distribuídos uniformemente em SN01 e SN03 (sessão de destino etc)
3. Horas
de início do backup alteradas 4. Adicionados estes parâmetros nas informações do aplicativo NMDA DB2:

NSR_MAX_START_RETRIES=50
NSR_FXBUSY_RETRIES=10
NSR_MMDB_RETRY_TIME=10

5. Aumento do tempo de espera excedido de inatividade para 300, Repetições = 2, Atraso para repetição = 10

Affected Products

NetWorker Module for Databases and Applications
Article Properties
Article Number: 000183668
Article Type: Solution
Last Modified: 28 رجب 1447
Version:  6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.