PowerProtect : Les sauvegardes TSDM échouent avec des ABV0016 sur un hôte ESXi spécifique
Summary: La politique de protection des machines virtuelles (VM) rencontre des échecs de sauvegarde intermittents lors de l’exécution planifiée avec l’ID de message critique ABV0016.
Symptoms
ABV0016: VM Direct engine 'localhost' is unable to back up the virtual machine 'my-vm-name' on vCenter 'my-vcernter-name' because of a vCenter API issue. The VM Direct engine cannot complete the backup of this virtual machine because of a vCenter API operation did not complete successfully. To troubleshoot this issue: 1) Verify that the vCenter can be reached. 2) If the vCenter is busy, wait for some activities to complete and then retry the operation. 3) Verify that the virtual machine exists on the vCenter. Read Less Unable to create LWD snapshot. vCenter task 'task-#####' failed: VimFault: dp.vpx.fault.DpdThrottleLimitExceeded.summary'
YYYY-MM-DD HH:MM:SS TRACE: [a30a8b8946958a4e;8d8911578980c3ff] SDM Data Mover: SDM Full Sync: Closed file 'VM_Image_Daily_NON-SQL-uklpdtsbk001-f4723/PLCTLP-2832693c-377a-4f7e-952f-ffc1fdade2b1/Backups/c57b4143-f4c3-4760-86f5-7448429205ae/501efcd4-1f7e-5c9d-b98c-43633d01aa4c/lastSdmDiskBackupPath.json'. YYYY-MM-DD HH:MM:SS TRACE: [a30a8b8946958a4e;8d8911578980c3ff] SDM Data Mover: SDM Full Sync: Checking if the last path exists which was used as a baseline for each disk ... YYYY-MM-DD HH:MM:SS INFO: [a30a8b8946958a4e;8d8911578980c3ff] SDM Data Mover: SDM Full Sync: Full sync is not needed, skipping. YYYY-MM-DD HH:MM:SS TRACE: [a30a8b8946958a4e;8d8911578980c3ff] SDM Data Mover: Create LWD Snapshot: vCenter SOAP call 'DpSnapshot' was accepted. YYYY-MM-DD HH:MM:SS ERROR: [a30a8b8946958a4e;8d8911578980c3ff] SDM Data Mover: Create LWD Snapshot: The vCenter task failed: dp.vpx.fault.DpdThrottleLimitExceeded.summary YYYY-MM-DD HH:MM:SS ERROR: [a30a8b8946958a4e;8d8911578980c3ff] SDM Data Mover: Create LWD Snapshot: The vCenter task for 'Create SDM Snapshot' completed with state 'error'. YYYY-MM-DD HH:MM:SS ERROR: [a30a8b8946958a4e;8d8911578980c3ff] SDM Data Mover: Create LWD Snapshot: Unable to create SDM snapshot. YYYY-MM-DD HH:MM:SS TRACE: [a30a8b8946958a4e;8d8911578980c3ff] SDM Data Mover: Create LWD Snapshot: Retrying in 500ms... ... YYYY-MM-DD HH:MM:SS TRACE: [a30a8b8946958a4e;8d8911578980c3ff] SDM Data Mover: Create LWD Snapshot: vCenter SOAP call 'DpSnapshot' was accepted. YYYY-MM-DD HH:MM:SS ERROR: [a30a8b8946958a4e;8d8911578980c3ff] SDM Data Mover: Create LWD Snapshot: The vCenter task failed: dp.vpx.fault.DpdThrottleLimitExceeded.summary YYYY-MM-DD HH:MM:SS ERROR: [a30a8b8946958a4e;8d8911578980c3ff] SDM Data Mover: Create LWD Snapshot: The vCenter task for 'Create SDM Snapshot' completed with state 'error'. YYYY-MM-DD HH:MM:SS ERROR: [a30a8b8946958a4e;8d8911578980c3ff] SDM Data Mover: Create LWD Snapshot: Unable to create SDM snapshot. YYYY-MM-DD HH:MM:SS ERROR: [a30a8b8946958a4e;8d8911578980c3ff] SDM Data Mover: Create LWD Snapshot: Unsuccessful after 98 attempts over 1m0.158271936s. YYYY-MM-DD HH:MM:SS TRACE: [a30a8b8946958a4e;8d8911578980c3ff] SDM Data Mover: Snapshot failure can't be remedied by a Full sync.Le client Web vSphere affiche au moins un hôte ESXi avec des erreurs continues basées sur LWD lors de l’exécution planifiée.
La sortie du bundle de support vCenter /var/log/vmware/vsan-health/vsanvcmgmtd-*.log indique que l’hôte ESXi est identifié comme un hôte DPD hérité :
YYYY-MM-DD HH:MM:SS warning vsanvcmgmtd[11593] [vSAN@6876 sub=dps] [opId=0849c23c] Found legacy DPD on host: host-29. Applying legacy throttle limit: '10', instead of regular throttle limit: '20'
Cause
Si le cache du service vCenter vSAN Health possède des informations de version obsolètes ou une entrée nulle, il classe l’hôte ESXi comme existant. La régulation par défaut de PowerProtect Data Manager envoie 18 sessions de sauvegarde SDM par hôte ESXi. L’hôte ESXi traite les 10 sauvegardes SDM initiales, mais vCenter échoue toutes les sauvegardes SDM suivantes indiquant que la limite DPD a été dépassée.
Resolution
Des améliorations apportées à vSphere 8.0 U1 actualisent automatiquement le cache du service vSAN Health dans certaines conditions. Il est recommandé d’effectuer une mise à niveau vers vSphere 8.0 U1 pour tirer parti de ces améliorations et éviter certains symptômes du cache du service vSAN Health.
Solution de contournement VMware :
Assurez-vous que le serveur vCenter et tous les hôtes ESXi du cluster exécutent la version 7.0 U3d ou une version plus récente. Videz le cache en redémarrant le service vSAN Health vCenter Server Appliance (VCSA) via une session SSH :
service-control --restart vsan-health
Si nécessaire, contactez le support VMware pour obtenir plus d’informations ou de l’aide avec le service vSAN Health.
Additional Information
Solution de contournement PowerProtect Data Manager :
Il existe une méthode dans PowerProtect Data Manager pour réduire la valeur de régulation des sessions de sauvegarde TSDM sur tous les hôtes ESXi. Cela peut être utilisé comme solution de contournement temporaire lors de la mise à niveau des hôtes ESXi ou de l’utilisation du support VMware.
- Assurez-vous qu’aucune tâche de protection n’est en cours d’exécution
- Connectez-vous à PowerProtect Data Manager et accédez à sudo : sudo su -
- Effectuez une copie du fichier vmdirect.env : cp vmdirect.env vmdirect.env.orig
- Fichier vmdirect.env de l’environnement ouvert : vi /opt/emc/vmdirect/unit/vmdirect.env
- Remplacez la valeur de la variable d’environnement « MAX_SDM_BACKUP_SESSIONS_PER_HOST » par 10 (au lieu de 18) et enregistrez le fichier.
- Redémarrez le service VISD :
systemctl restart visd.service
Exemple de résultat :
my-ppdm:/opt/emc/vmdirect/unit # cp vmdirect.env vmdirect.env.orig
my-ppdm:/opt/emc/vmdirect/unit # ls -l
total 20
-rwxr-xr-x 1 root root 397 Nov 2 22:48 visd.service
-rwxr-xr-x 1 root root 2225 Nov 2 22:48 vmdirect.env
-rwx------ 1 root root 2225 Apr 21 09:39 vmdirect.env.orig
-rwxr-xr-x 1 root root 360 Nov 2 22:48 vpod-nas.service
-rwxr-xr-x 1 root root 334 Nov 2 22:48 vpod.service
my-ppdm:/opt/emc/vmdirect/unit # vi vmdirect.env
my-ppdm:/opt/emc/vmdirect/unit # cat vmdirect.env | grep SDM
SDM_ENABLED_EXTERNAL_PROXIES=false
export SDM_ENABLED_EXTERNAL_PROXIES
MAX_SDM_SESSIONS_PER_HOST=20
export MAX_SDM_SESSIONS_PER_HOST
MAX_SDM_BACKUP_SESSIONS_PER_HOST=10
export MAX_SDM_BACKUP_SESSIONS_PER_HOST
MAX_ESX_SDM_TOTAL_DISKS=40
export MAX_ESX_SDM_TOTAL_DISKS
my-ppdm:/opt/emc/vmdirect/unit # systemctl restart visd.service
my-ppdm:/opt/emc/vmdirect/unit # systemctl status visd.service
● visd.service - VMDirect Infrastructure Services Daemon
Loaded: loaded (/usr/lib/systemd/system/visd.service; enabled; vendor preset: disabled)
Active: active (running) since Fri YYYY-04-21 09:42:38 PDT; 7s ago
Main PID: 67488 (visd)
Tasks: 16 (limit: 512)
Memory: 23.2M
CPU: 317ms
CGroup: /system.slice/visd.service
└─67488 /opt/emc/vmdirect/bin/visd -user admin -group app -p 9097 -nodemgmt -proxymgmt -vmdeployment -installclient -l
Apr 21 09:42:38 my-ppdm.my-domain.com systemd[1]: Started VMDirect Infrastructure Services Daemon.
Apr 21 09:42:38 my-ppdm.my-domain.com visd[67488]: INFO: Found GID 2000 (app) for group 'app'.
Apr 21 09:42:38 my-ppdm.my-domain.com visd[67488]: NOTICE: Effective group ID is set to 2000 (app).
Apr 21 09:42:38 my-ppdm.my-domain.com visd[67488]: INFO: Found UID 500 (admin) for user 'admin'.
Apr 21 09:42:38 my-ppdm.my-domain.com visd[67488]: NOTICE: Effective user ID is set to 500 (admin).
my-ppdm:/opt/emc/vmdirect/unit #