Avamar Client : La sauvegarde de l’image client IDPA Linux se termine avec exception en raison d’un problème de mise en veille
Summary: Échec des clients de sauvegarde d’image Linux avec le message Backup Completed with exception Error code 10020
Symptoms
La sauvegarde d’image Linux pour le système IDPA « Se termine avec exception » en raison du problème de mise en veille.
Dans cet exemple, la machine virtuelle est la machine virtuelle ACM interne fournie avec la solution IDPA.
À partir du journal d’image VMware Linux de la sauvegarde, vous pouvez voir les éléments suivants :
avvcbimage Info <40726>: VM Config Info: VMX version 4(F), ctk enabled(T), fault tolerant (F), Guest OS SUSE Linux Enterprise 12 (64-bit), Cloud UUID = NoUUID. version=9
avvcbimage Info <40727>: VM Guest Info: GuestOS Family = linuxGuest, Guest Full Name = SUSE Linux Enterprise 12 (64-bit), Guest OS State = running, Tools Running = guestToolsRunning, Tools Version Status = guestToolsUnmanaged
avvcbimage Info <42650>: Creating snapshot 'Avamar-<epoch_time><client_id>', quiesceFS=1
avvcbimage Info <41136>: SnapshotManager: createSnapshot for vmMoref = vm-21
avvcbimage Info <42182>: SnapshotManager: POST to /snapshotmanager/vm/vm-21/action/createSnapshot, payload({
"snapshotName": "Avamar-<epoch_time><client_id>",
"snapshotDesc": "Created by Avamar workorder Management_VM_Backup-Management_VM_Backup-<epoch > on <date>",
"quiesceFileSystem": "true"
...
avvcbimage Warning <19733>: vSphere Task failed (quiesce, snapshot error=45): 'An error occurred while saving the snapshot: Failed to quiesce the virtual machine.'.
avvcbimage Error <17775>: Snapshot 'Avamar-<epoch_time><client_id> ' creation for VM '[vsanDatastore] DataProtection-ACM/DataProtection-ACM.vmx' task creation encountered a quiesce problem
avvcbimage Warning <40710>: The VM could not be quiesced prior to snapshot creation and this backup will not be used as a base for subsequent CBT backups if successful.
avvcbimage Warning <40711>: Consider using the pre-freeze and post-thaw scripts to facilitate VM quiescing
avvcbimage Warning <41146>: This error might caused by the pre-freeze script returning a non-zero error code.
...
Après l’échec de la première tâche de snapshot, la sauvegarde se poursuit en prenant un deuxième snapshot, mais avec la fonctionnalité de mise en veille désactivée.
avvcbimage Info <14631>: VM Disk Consolidation for '[vsanDatastore] DataProtection-ACM/DataProtection-ACM.vmx' task still in progress, sleep for 3 sec
avvcbimage Info <42650>: Creating snapshot 'Avamar-<epoch_time><client_id>', quiesceFS=0
avvcbimage Info <41136>: SnapshotManager: createSnapshot for vmMoref = vm-21
avvcbimage Info <42182>: SnapshotManager: POST to /snapshotmanager/vm/vm-21/action/createSnapshot, payload({
"snapshotName": "Avamar-<epoch_time><client_id>",
"snapshotDesc": "Created by Avamar workorder Management_VM_Backup-Management_VM_Backup-<epoch> on <date>",
"quiesceFileSystem": "false"
La sauvegarde se termine, mais s’affiche comme terminée avec exception (code 10020)
Dans le journal de l’ordre de travail (.alg), on peut lire ce qui suit :
2019-04-03 00:12:42 Management_VM_Backup-Management_VM_Backup-<epoch>Warning <0000>: Workorder "Management_VM_Backup-Management_VM_Backup-epoch" non-zero exit status 'code 170: completed with errors, client log should be examined'
Cause
-
Pour voir ce qui cause l’échec de la mise en veille, définissez la journalisation du débogage pour les vmtools.
Suivez les étapes décrites dans https://kb.vmware.com/s/article/1007873pour définir la journalisation du débogage sur le système d’exploitation invité, puis redémarrer les outils VMware.
-
Effectuez une nouvelle sauvegarde pour recréer l’échec de la mise en veille.
-
Passez en revue les logs des outils de débogage (les informations de mise en veille doivent se trouver dans le log vmsvc et comporter un préfixe [vmbackup]).
Dans cet exemple, le problème était dû à la suppression partielle d’un répertoire /var/log/brs. Ce répertoire n’a pas pu être entièrement supprimé car le processus en arrière-plan avait toujours ouvert le répertoire. Ce dossier partiellement supprimé empêche le système de fichiers Linux de cesser de répondre avec les fonctions ioctls.
[ debug] [vmbackup] Submitted backup start task.
[ debug] [vmbackup] *** VmBackupSyncDriverStart
[ debug] [vmsvc] SyncDriver: Skipping remote filesystem, name=systemd-1, mntpt=/proc/sys/fs/binfmt_misc.
[ debug] [vmsvc] SyncDriver: Calling backend 0.
[ debug] [vmsvc] SyncDriver: Freezing using Linux ioctls...
[ debug] [vmsvc] SyncDriver: opening path '/var/lib/named/proc'.
[ debug] [vmsvc] SyncDriver: freezing path '/var/lib/named/proc'.
[ debug] [vmsvc] SyncDriver: freeze on '/var/lib/named/proc' returned: 95 (Operation not supported)
[ debug] [vmsvc] SyncDriver: opening path '/var/log/logbundles'.
[ debug] [vmsvc] SyncDriver: freezing path '/var/log/logbundles'.
[ debug] [vmsvc] SyncDriver: successfully froze '/var/log/logbundles'.
[ debug] [vmsvc] SyncDriver: opening path '/var/log/brs (deleted)'.
[ debug] [vmsvc] SyncDriver: failed to open '/var/log/brs (deleted)': 2 (No such file or directory)
[ warning] [vmbackup] Error freezing filesystems.
Resolution
Un examen plus approfondi du répertoire /var/log/brs avec peut détecter des problèmes lors de l’ouverture de ce répertoire à partir d’autres commandes. Comme lsof et stat affichent également le problème.
IDPA-ACM:/var/log # lsof|grep brs lsof: WARNING: can't stat() xfs file system /var/log/brs (deleted) Output information may be incomplete. IDPA-ACM:/var/log # ls -al drwxr-xr-x 0 root root 6 Feb 27 2018 brs
La machine virtuelle ACM a été redémarrée pour arrêter le processus acm en arrière-plan. Après le redémarrage, le répertoire /var/log/brs a été recréé par le processus ACM et la sauvegarde a pu se terminer sans d’autres problèmes de mise en veille.
IDPA-ACM:/var/log # ls -al drwxr-xr-x 2 root root 6 Apr 15 10:30 brs
Additional Information
Assurez-vous de suivre la base de connaissances ci-dessus pour supprimer la journalisation de débogage pour les vmtools sur le client et redémarrer le service vmtools.