Klient Avamar: Zálohování bitové kopie klienta IDPA Linux se dokončí s výjimkou kvůli problému s nečinným stavem
Summary: Klienti zálohování bitové kopie systému Linux selhávají, zálohování bylo dokončeno s výjimkou Kód chyby 10020
Symptoms
Záloha bitové kopie systému Linux pro systém IDPA se kvůli problému s uvedením do nečinnosti zobrazuje jako "Dokončeno s výjimkou".
V tomto příkladu se jednalo o interní virtuální počítač ACM, který se dodává s řešením IDPA.
Z protokolu bitové kopie systému VMware Linux ze zálohy je patrné následující:
avvcbimage Info <40726>: VM Config Info: VMX version 4(F), ctk enabled(T), fault tolerant (F), Guest OS SUSE Linux Enterprise 12 (64-bit), Cloud UUID = NoUUID. version=9
avvcbimage Info <40727>: VM Guest Info: GuestOS Family = linuxGuest, Guest Full Name = SUSE Linux Enterprise 12 (64-bit), Guest OS State = running, Tools Running = guestToolsRunning, Tools Version Status = guestToolsUnmanaged
avvcbimage Info <42650>: Creating snapshot 'Avamar-<epoch_time><client_id>', quiesceFS=1
avvcbimage Info <41136>: SnapshotManager: createSnapshot for vmMoref = vm-21
avvcbimage Info <42182>: SnapshotManager: POST to /snapshotmanager/vm/vm-21/action/createSnapshot, payload({
"snapshotName": "Avamar-<epoch_time><client_id>",
"snapshotDesc": "Created by Avamar workorder Management_VM_Backup-Management_VM_Backup-<epoch > on <date>",
"quiesceFileSystem": "true"
...
avvcbimage Warning <19733>: vSphere Task failed (quiesce, snapshot error=45): 'An error occurred while saving the snapshot: Failed to quiesce the virtual machine.'.
avvcbimage Error <17775>: Snapshot 'Avamar-<epoch_time><client_id> ' creation for VM '[vsanDatastore] DataProtection-ACM/DataProtection-ACM.vmx' task creation encountered a quiesce problem
avvcbimage Warning <40710>: The VM could not be quiesced prior to snapshot creation and this backup will not be used as a base for subsequent CBT backups if successful.
avvcbimage Warning <40711>: Consider using the pre-freeze and post-thaw scripts to facilitate VM quiescing
avvcbimage Warning <41146>: This error might caused by the pre-freeze script returning a non-zero error code.
...
Po selhání první úlohy snapshotu pokračuje zálohování pořízením druhého snapshotu, ale funkce uvedení do nečinnosti je zakázána.
avvcbimage Info <14631>: VM Disk Consolidation for '[vsanDatastore] DataProtection-ACM/DataProtection-ACM.vmx' task still in progress, sleep for 3 sec
avvcbimage Info <42650>: Creating snapshot 'Avamar-<epoch_time><client_id>', quiesceFS=0
avvcbimage Info <41136>: SnapshotManager: createSnapshot for vmMoref = vm-21
avvcbimage Info <42182>: SnapshotManager: POST to /snapshotmanager/vm/vm-21/action/createSnapshot, payload({
"snapshotName": "Avamar-<epoch_time><client_id>",
"snapshotDesc": "Created by Avamar workorder Management_VM_Backup-Management_VM_Backup-<epoch> on <date>",
"quiesceFileSystem": "false"
Zálohování se dokončí, ale zobrazí se jako dokončené s výjimkou (kód 10020)
V protokolu pracovního příkazu (.alg) je zobrazeno následující:
2019-04-03 00:12:42 Management_VM_Backup-Management_VM_Backup-<epoch>Warning <0000>: Workorder "Management_VM_Backup-Management_VM_Backup-epoch" non-zero exit status 'code 170: completed with errors, client log should be examined'
Cause
-
Pokud chcete zjistit, co způsobuje selhání uvedení do nečinnosti, nastavte protokolování ladění pro nástroje vmtools.
Pomocí následujících kroků https://kb.vmware.com/s/article/1007873nastavit protokolování ladění v hostovaném operačním systému a poté restartovat nástroje VMware.
-
Proveďte novou zálohu, aby se znovu vytvořilo selhání nečinnosti.
-
Zkontrolujte protokoly ladicích nástrojů (informace o nečinnosti by měly být v protokolu vmsvc a měly by mít předponu [vmbackup]).
V tomto příkladu byl problém způsoben částečně odstraněným adresářem /var/log/brs. Tento adresář nebylo možné zcela odebrat, protože proces na pozadí měl adresář stále otevřený. Tato částečně odstraněná složka brání tomu, aby systém souborů Linux přestal reagovat s funkcemi ioctls.
[ debug] [vmbackup] Submitted backup start task.
[ debug] [vmbackup] *** VmBackupSyncDriverStart
[ debug] [vmsvc] SyncDriver: Skipping remote filesystem, name=systemd-1, mntpt=/proc/sys/fs/binfmt_misc.
[ debug] [vmsvc] SyncDriver: Calling backend 0.
[ debug] [vmsvc] SyncDriver: Freezing using Linux ioctls...
[ debug] [vmsvc] SyncDriver: opening path '/var/lib/named/proc'.
[ debug] [vmsvc] SyncDriver: freezing path '/var/lib/named/proc'.
[ debug] [vmsvc] SyncDriver: freeze on '/var/lib/named/proc' returned: 95 (Operation not supported)
[ debug] [vmsvc] SyncDriver: opening path '/var/log/logbundles'.
[ debug] [vmsvc] SyncDriver: freezing path '/var/log/logbundles'.
[ debug] [vmsvc] SyncDriver: successfully froze '/var/log/logbundles'.
[ debug] [vmsvc] SyncDriver: opening path '/var/log/brs (deleted)'.
[ debug] [vmsvc] SyncDriver: failed to open '/var/log/brs (deleted)': 2 (No such file or directory)
[ warning] [vmbackup] Error freezing filesystems.
Resolution
Při bližším prozkoumání adresáře /var/log/brs můžete vidět problémy s otevíráním tohoto adresáře z jiných příkazů. Stejně jako lsof a stat také ukazují problém.
IDPA-ACM:/var/log # lsof|grep brs lsof: WARNING: can't stat() xfs file system /var/log/brs (deleted) Output information may be incomplete. IDPA-ACM:/var/log # ls -al drwxr-xr-x 0 root root 6 Feb 27 2018 brs
Virtuální počítač ACM byl restartován, aby byl ukončen proces acm na pozadí. Po restartování byl adresář /var/log/brs znovu vytvořen procesem ACM a zálohování se dokončilo bez dalších problémů s nečinným stavem.
IDPA-ACM:/var/log # ls -al drwxr-xr-x 2 root root 6 Apr 15 10:30 brs
Additional Information
Ujistěte se, že postupujete podle výše uvedeného článku znalostní databáze, odeberte protokolování ladění pro nástroje vmtools na klientovi a restartujte službu vmtools.