Avamar Client: Backup da imagem do client Linux do IDPA concluído com exceção devido a problema de desativação
Summary: Falha nos clients de backup de imagem do Linux com backup concluído com exceção Código de erro 10020
Symptoms
O backup de imagem do Linux para o sistema IDPA está "Concluindo com exceção" devido ao problema de desativação.
Neste exemplo, a vm foi a VM interna do ACM que vem com a solução IDPA.
No registro de imagem do VMware Linux do backup, é possível ver o seguinte:
avvcbimage Info <40726>: VM Config Info: VMX version 4(F), ctk enabled(T), fault tolerant (F), Guest OS SUSE Linux Enterprise 12 (64-bit), Cloud UUID = NoUUID. version=9
avvcbimage Info <40727>: VM Guest Info: GuestOS Family = linuxGuest, Guest Full Name = SUSE Linux Enterprise 12 (64-bit), Guest OS State = running, Tools Running = guestToolsRunning, Tools Version Status = guestToolsUnmanaged
avvcbimage Info <42650>: Creating snapshot 'Avamar-<epoch_time><client_id>', quiesceFS=1
avvcbimage Info <41136>: SnapshotManager: createSnapshot for vmMoref = vm-21
avvcbimage Info <42182>: SnapshotManager: POST to /snapshotmanager/vm/vm-21/action/createSnapshot, payload({
"snapshotName": "Avamar-<epoch_time><client_id>",
"snapshotDesc": "Created by Avamar workorder Management_VM_Backup-Management_VM_Backup-<epoch > on <date>",
"quiesceFileSystem": "true"
...
avvcbimage Warning <19733>: vSphere Task failed (quiesce, snapshot error=45): 'An error occurred while saving the snapshot: Failed to quiesce the virtual machine.'.
avvcbimage Error <17775>: Snapshot 'Avamar-<epoch_time><client_id> ' creation for VM '[vsanDatastore] DataProtection-ACM/DataProtection-ACM.vmx' task creation encountered a quiesce problem
avvcbimage Warning <40710>: The VM could not be quiesced prior to snapshot creation and this backup will not be used as a base for subsequent CBT backups if successful.
avvcbimage Warning <40711>: Consider using the pre-freeze and post-thaw scripts to facilitate VM quiescing
avvcbimage Warning <41146>: This error might caused by the pre-freeze script returning a non-zero error code.
...
Depois que a primeira tarefa de snapshot falhar, o backup prosseguirá com a obtenção de um segundo snapshot, mas com o recurso de desativação desativado.
avvcbimage Info <14631>: VM Disk Consolidation for '[vsanDatastore] DataProtection-ACM/DataProtection-ACM.vmx' task still in progress, sleep for 3 sec
avvcbimage Info <42650>: Creating snapshot 'Avamar-<epoch_time><client_id>', quiesceFS=0
avvcbimage Info <41136>: SnapshotManager: createSnapshot for vmMoref = vm-21
avvcbimage Info <42182>: SnapshotManager: POST to /snapshotmanager/vm/vm-21/action/createSnapshot, payload({
"snapshotName": "Avamar-<epoch_time><client_id>",
"snapshotDesc": "Created by Avamar workorder Management_VM_Backup-Management_VM_Backup-<epoch> on <date>",
"quiesceFileSystem": "false"
O backup é concluído, mas exibido como concluído com exceção (código 10020)
No registro de ordem de trabalho (.alg), é exibido o seguinte:
2019-04-03 00:12:42 Management_VM_Backup-Management_VM_Backup-<epoch>Warning <0000>: Workorder "Management_VM_Backup-Management_VM_Backup-epoch" non-zero exit status 'code 170: completed with errors, client log should be examined'
Cause
-
Para ver o que está causando a falha de desativação, defina o log de depuração para o vmtools.
Seguindo as etapas no https://kb.vmware.com/s/article/1007873para definir o log de depuração no sistema operacional convidado e, em seguida, reiniciar o VMware Tools.
-
Faça um novo backup para recriar a falha de desativação.
-
Analise os logs das ferramentas de depuração (as informações de desativação devem estar no log vmsvc e ter um prefixo [vmbackup]).
Neste exemplo, o problema foi causado por um diretório /var/log/brs parcialmente excluído. Não foi possível remover totalmente esse diretório porque o diretório ainda estava aberto durante o processo de segundo plano. Essa pasta parcialmente excluída impede que o file system do Linux pare de responder com funções ioctls.
[ debug] [vmbackup] Submitted backup start task.
[ debug] [vmbackup] *** VmBackupSyncDriverStart
[ debug] [vmsvc] SyncDriver: Skipping remote filesystem, name=systemd-1, mntpt=/proc/sys/fs/binfmt_misc.
[ debug] [vmsvc] SyncDriver: Calling backend 0.
[ debug] [vmsvc] SyncDriver: Freezing using Linux ioctls...
[ debug] [vmsvc] SyncDriver: opening path '/var/lib/named/proc'.
[ debug] [vmsvc] SyncDriver: freezing path '/var/lib/named/proc'.
[ debug] [vmsvc] SyncDriver: freeze on '/var/lib/named/proc' returned: 95 (Operation not supported)
[ debug] [vmsvc] SyncDriver: opening path '/var/log/logbundles'.
[ debug] [vmsvc] SyncDriver: freezing path '/var/log/logbundles'.
[ debug] [vmsvc] SyncDriver: successfully froze '/var/log/logbundles'.
[ debug] [vmsvc] SyncDriver: opening path '/var/log/brs (deleted)'.
[ debug] [vmsvc] SyncDriver: failed to open '/var/log/brs (deleted)': 2 (No such file or directory)
[ warning] [vmbackup] Error freezing filesystems.
Resolution
Um exame mais detalhado do diretório /var/log/brs com pode ver problemas ao abrir esse diretório a partir de outros comandos. Como lsof e stat também mostram problema.
IDPA-ACM:/var/log # lsof|grep brs lsof: WARNING: can't stat() xfs file system /var/log/brs (deleted) Output information may be incomplete. IDPA-ACM:/var/log # ls -al drwxr-xr-x 0 root root 6 Feb 27 2018 brs
A máquina virtual do ACM foi reinicializada para encerrar o processo de acm em segundo plano. Após a reinicialização, o diretório /var/log/brs foi recriado pelo processo do ACM e o backup pôde ser concluído sem mais problemas de desativação.
IDPA-ACM:/var/log # ls -al drwxr-xr-x 2 root root 6 Apr 15 10:30 brs
Additional Information
Siga as instruções da KB acima para remover o log de depuração do vmtools no client e reinicie o serviço vmtools.