Avamar: MSG_ERR_DDR_ERROR de coleta de lixo após a desativação do client no IB/RLCE de origem do Avamar
Summary: A coleta de lixo falhará no destino do Avamar após 8 dias se /MC_RETIRED estiver ausente na política de replicação ou no período de bloqueio de retenção para clients desativados.
Symptoms
Esse comportamento é visto na seguinte configuração e cenário:
- Origem do Avamar com backups imutáveis ativados (IB)
- Destino do Avamar com backups imutáveis ativados (IB)
- Origem do Data Domain com o modo de conformidade de retenção de bloqueio ativado (RLCE)
- Destino do Data Domain com modo de conformidade de retenção de bloqueio ativado (RLCE)
A configuração da política de replicação não inclui o domínio /MC_RETIRED.
admin@av-target:~/usr/local/avamar/var/ddrmaintlogs$ view ddrmaint.log
...
2024-09-29T06:14:35.625021-07:00 av-target ddrmaint.bin[4202]: Error: gc-finish::process_all_backups: Failed to delete empty client dir 'cur/51e83a682d09d64199cf00469262db1b07f5ef04' on ddr, client '/MC_DELETED/prod-fs-20240921_190514', rename to 'cur/DELETED/1727740800/51e83a682d09d64199cf00469262db1b07f5ef04_E0F1E861F424A74A6A31B8B4963A4CB036ACC77D', ddr result code: 5034, desc: the user has insufficient privilege
2024-09-29T06:14:35.625126-07:00 av-target ddrmaint.bin[4202]: Warning: gc-finish::process_all_cids - Failed to process backups in client dir '51e83a682d09d64199cf00469262db1b07f5ef04' for client '/MC_DELETED/prod-fs-20240921_190514'
admin@av-target:~/usr/local/avamar/var/ddrmaintlogs$
No servidor de origem do Avamar, há um client com as seguintes informações:
CID: 51e83a682d09d64199cf00469262db1b07f5ef04
Client hostname: /clients/Windows/prod-fs
Em 21 de setembro, esse cliente foi aposentado. O client foi movido para /MC_RETIRED/prod-fs2024.09.21.01.23.45.
No mesmo dia, esse client foi adicionado novamente, criando um novo ID de client (CID) e usando o mesmo nome de host do client:
CID: 4140cb8f428aa413154139b186fdcaafa19eb04e
Client hostname: /clients/Windows/prod-fs
A política de replicação não contém /MC_RETIRED, e a replicação ocorreu.
No destino do Avamar (av-target), o /usr/local/avamar/var/ddrmaintlogs/ddrmaint.log mostra ddrmaint move-backup comando:
admin@av-target:~/usr/local/avamar/var/ddrmaintlogs$ view ddrmaint.log
....
2024-09-21T12:05:22.483376-07:00 av-target ddrmaint.bin[14757]: Info: move-backup cmdline: '/usr/local/avamar/bin/ddrmaint.bin --flagfile=/usr/local/avamar/etc/usersettings.cfg --server=av-target --vardir=/usr/local/avamar/var --bindir=/usr/local/avamar/bin --id=root --password=**************** --vardir=/usr/local/avamar/var --bindir=/usr/local/avamar/bin --sysdir=/usr/local/avamar/etc move-backup --source-client=51e83a682d09d64199cf00469262db1b07f5ef04 --target-client=4140cb8f428aa413154139b186fdcaafa19eb04e --backups=0x1db0aed1ab804ea:2 --dpnid=1234567890'
2024-09-21T12:05:23.604561-07:00 av-target ddrmaint.bin[14757]: Info: RL: As the DD is in Compliance Enabled mode move-backup::movebackups will be copy-backup with no retention on ddr index(2) from cur/51e83a682d09d64199cf00469262db1b07f5ef04/1DB0AED1AB804EA to cur/4140cb8f428aa413154139b186fdcaafa19eb04e/1DB0AED1AB804EA
2024-09-21T12:05:24.610402-07:00 av-target ddrmaint.bin[14757]: Info: move-backup Successfully copied (for move) client backup cur/51e83a682d09d64199cf00469262db1b07f5ef04/1DB0AED1AB804EA:2 to cur/4140cb8f428aa413154139b186fdcaafa19eb04e/1DB0AED1AB804EA:2.
...
admin@av-target:~/usr/local/avamar/var/ddrmaintlogs$
Após 6 dias (27 de setembro) até 29 de setembro, há mensagens informando que os backups do CID antigo não existem mais no GSAN:
admin@av-target:~/usr/local/avamar/var/ddrmaintlogs$ view ddrmaint.log
...
2024-09-27T06:21:50.895312-07:00 av-target ddrmaint.bin[8923]: Info: gc-finish::process_all_backups: Backup '1DB0A201463FE64' not on gsan, deleted on ddr, client dir '51e83a682d09d64199cf00469262db1b07f5ef04', client '/MC_DELETED/prod-fs-20240921_190514'
2024-09-27T06:21:50.910186-07:00 av-target ddrmaint.bin[8923]: Info: gc-finish::process_all_backups: Backup '1DB0A22594F1476' not on gsan, deleted on ddr, client dir '51e83a682d09d64199cf00469262db1b07f5ef04', client '/MC_DELETED/prod-fs-20240921_190514'
2024-09-28T06:19:59.618801-07:00 av-target ddrmaint.bin[27334]: Info: gc-finish::process_all_backups: Backup '1DB0AE8A240B1AA' not on gsan, deleted on ddr, client dir '51e83a682d09d64199cf00469262db1b07f5ef04', client '/MC_DELETED/prod-fs-20240921_190514'
2024-09-28T06:19:59.631409-07:00 av-target ddrmaint.bin[27334]: Info: gc-finish::process_all_backups: Backup '1DB0AED1AB804EA' not on gsan, deleted on ddr, client dir '51e83a682d09d64199cf00469262db1b07f5ef04', client '/MC_DELETED/prod-fs-20240921_190514'
...
admin@av-target:~/usr/local/avamar/var/ddrmaintlogs$
Após 8 dias, a mensagem de erro "Failed to delete empty client dir" aparece:
Cause
O problema de falha de coleta de lixo (GC) surgiu quando: clientA_with_cid-1 foi desativado e adicionado novamente como clientA_with_cid-2. Durante a replicação, o replicador criou um novo caminho para clientA_with_cid-2 no destino e backups antigos copiados de clientA_with_cid-1 para clientA_with_cid-2. O processo de GC tentou excluir arquivos bloqueados, causando erros, já que o bloqueio de retenção impede a exclusão até que o período de retenção expire.
O problema principal ocorria quando o processo de coleta de lixo (GC) no destino falhava ao identificar esses backups órfãos no clientA_with_cid-1 caminho do diretório. O processo de GC tentou excluir arquivos bloqueados, causando erros porque o bloqueio de retenção impede a exclusão até que o período de retenção expire. Essa redundância e a incapacidade de remover a cópia órfã causaram a falha de GC.
Resolution
Aplique o seguinte hotfix:
- 19.10.0.166: 338891
- 19.12.0.186: 338894