PowerProtect: Los respaldos de TSDM fallan con ABV0016 en un host ESXi específico
Summary: La política de protección de máquinas virtuales (VM) detecta fallas de respaldo intermitentes durante la ejecución programada con el ID de mensaje crítico ABV0016.
Symptoms
ABV0016: VM Direct engine 'localhost' is unable to back up the virtual machine 'my-vm-name' on vCenter 'my-vcernter-name' because of a vCenter API issue. The VM Direct engine cannot complete the backup of this virtual machine because of a vCenter API operation did not complete successfully. To troubleshoot this issue: 1) Verify that the vCenter can be reached. 2) If the vCenter is busy, wait for some activities to complete and then retry the operation. 3) Verify that the virtual machine exists on the vCenter. Read Less Unable to create LWD snapshot. vCenter task 'task-#####' failed: VimFault: dp.vpx.fault.DpdThrottleLimitExceeded.summary'
YYYY-MM-DD HH:MM:SS TRACE: [a30a8b8946958a4e;8d8911578980c3ff] SDM Data Mover: SDM Full Sync: Closed file 'VM_Image_Daily_NON-SQL-uklpdtsbk001-f4723/PLCTLP-2832693c-377a-4f7e-952f-ffc1fdade2b1/Backups/c57b4143-f4c3-4760-86f5-7448429205ae/501efcd4-1f7e-5c9d-b98c-43633d01aa4c/lastSdmDiskBackupPath.json'. YYYY-MM-DD HH:MM:SS TRACE: [a30a8b8946958a4e;8d8911578980c3ff] SDM Data Mover: SDM Full Sync: Checking if the last path exists which was used as a baseline for each disk ... YYYY-MM-DD HH:MM:SS INFO: [a30a8b8946958a4e;8d8911578980c3ff] SDM Data Mover: SDM Full Sync: Full sync is not needed, skipping. YYYY-MM-DD HH:MM:SS TRACE: [a30a8b8946958a4e;8d8911578980c3ff] SDM Data Mover: Create LWD Snapshot: vCenter SOAP call 'DpSnapshot' was accepted. YYYY-MM-DD HH:MM:SS ERROR: [a30a8b8946958a4e;8d8911578980c3ff] SDM Data Mover: Create LWD Snapshot: The vCenter task failed: dp.vpx.fault.DpdThrottleLimitExceeded.summary YYYY-MM-DD HH:MM:SS ERROR: [a30a8b8946958a4e;8d8911578980c3ff] SDM Data Mover: Create LWD Snapshot: The vCenter task for 'Create SDM Snapshot' completed with state 'error'. YYYY-MM-DD HH:MM:SS ERROR: [a30a8b8946958a4e;8d8911578980c3ff] SDM Data Mover: Create LWD Snapshot: Unable to create SDM snapshot. YYYY-MM-DD HH:MM:SS TRACE: [a30a8b8946958a4e;8d8911578980c3ff] SDM Data Mover: Create LWD Snapshot: Retrying in 500ms... ... YYYY-MM-DD HH:MM:SS TRACE: [a30a8b8946958a4e;8d8911578980c3ff] SDM Data Mover: Create LWD Snapshot: vCenter SOAP call 'DpSnapshot' was accepted. YYYY-MM-DD HH:MM:SS ERROR: [a30a8b8946958a4e;8d8911578980c3ff] SDM Data Mover: Create LWD Snapshot: The vCenter task failed: dp.vpx.fault.DpdThrottleLimitExceeded.summary YYYY-MM-DD HH:MM:SS ERROR: [a30a8b8946958a4e;8d8911578980c3ff] SDM Data Mover: Create LWD Snapshot: The vCenter task for 'Create SDM Snapshot' completed with state 'error'. YYYY-MM-DD HH:MM:SS ERROR: [a30a8b8946958a4e;8d8911578980c3ff] SDM Data Mover: Create LWD Snapshot: Unable to create SDM snapshot. YYYY-MM-DD HH:MM:SS ERROR: [a30a8b8946958a4e;8d8911578980c3ff] SDM Data Mover: Create LWD Snapshot: Unsuccessful after 98 attempts over 1m0.158271936s. YYYY-MM-DD HH:MM:SS TRACE: [a30a8b8946958a4e;8d8911578980c3ff] SDM Data Mover: Snapshot failure can't be remedied by a Full sync.El cliente web vSphere muestra al menos un host ESXi con errores continuos basados en LWD durante la ejecución programada.
La salida / var/log/vmware/vsan-health/vsanvcmgmtd-*.log del paquete de soporte de vCenter muestra que el host ESXi se identifica como un host DPD heredado:
YYYY-MM-DD HH:MM:SS warning vsanvcmgmtd[11593] [vSAN@6876 sub=dps] [opId=0849c23c] Found legacy DPD on host: host-29. Applying legacy throttle limit: '10', instead of regular throttle limit: '20'
Cause
Si la caché del servicio de estado de vCenter vSAN tiene información de versión obsoleta o una entrada nula, categoriza el host ESXi como heredado. La regulación predeterminada de PowerProtect Data Manager envía 18 sesiones de respaldo de SDM por host ESXi. El host ESXi procesa los 10 respaldos de SDM iniciales, pero vCenter fallaría cualquier respaldo de SDM posterior que indique que se superó el límite de DPD.
Resolution
Hay mejoras en vSphere 8.0 U1 que actualizan automáticamente la caché del servicio vSAN Health en ciertas condiciones. Se recomienda actualizar a vSphere 8.0 U1 para aprovechar estas mejoras y evitar ciertos síntomas de caché del servicio vSAN Health.
Solución alternativa de VMware:
Asegúrese de que vCenter Server y todos los hosts ESXi del clúster sean de la versión 7.0 U3d o posterior. Borre la caché mediante el reinicio del servicio vSAN Health de vCenter Server Appliance (VCSA) a través de una sesión de SSH:
service-control --restart vsan-health
Si es necesario, póngase en contacto con el soporte de VMware para obtener más información o asistencia con el servicio de estado de vSAN.
Additional Information
Solución alternativa de PowerProtect Data Manager:
Hay un método en PowerProtect Data Manager para disminuir el valor de regulación para las sesiones de respaldo de TSDM en todos los hosts ESXi. Esto se puede utilizar como una solución alternativa temporal mientras actualiza los hosts ESXi o trabaja con el soporte de VMware.
- Asegúrese de que no haya trabajos de protección en ejecución
- Inicie sesión en PowerProtect Data Manager y eleve a sudo: sudo su -
- Haga una copia del archivo vmdirect.env: cp vmdirect.env vmdirect.env.orig
- Abra el archivo vmdirect.env del entorno: vi /opt/emc/vmdirect/unit/vmdirect.env
- Cambie el valor de la variable de entorno "MAX_SDM_BACKUP_SESSIONS_PER_HOST" a 10 (en lugar de 18) y guarde el archivo.
- Reinicie el servicio VISD :
systemctl restart visd.service
Ejemplo del mensaje de salida:
my-ppdm:/opt/emc/vmdirect/unit # cp vmdirect.env vmdirect.env.orig
my-ppdm:/opt/emc/vmdirect/unit # ls -l
total 20
-rwxr-xr-x 1 root root 397 Nov 2 22:48 visd.service
-rwxr-xr-x 1 root root 2225 Nov 2 22:48 vmdirect.env
-rwx------ 1 root root 2225 Apr 21 09:39 vmdirect.env.orig
-rwxr-xr-x 1 root root 360 Nov 2 22:48 vpod-nas.service
-rwxr-xr-x 1 root root 334 Nov 2 22:48 vpod.service
my-ppdm:/opt/emc/vmdirect/unit # vi vmdirect.env
my-ppdm:/opt/emc/vmdirect/unit # cat vmdirect.env | grep SDM
SDM_ENABLED_EXTERNAL_PROXIES=false
export SDM_ENABLED_EXTERNAL_PROXIES
MAX_SDM_SESSIONS_PER_HOST=20
export MAX_SDM_SESSIONS_PER_HOST
MAX_SDM_BACKUP_SESSIONS_PER_HOST=10
export MAX_SDM_BACKUP_SESSIONS_PER_HOST
MAX_ESX_SDM_TOTAL_DISKS=40
export MAX_ESX_SDM_TOTAL_DISKS
my-ppdm:/opt/emc/vmdirect/unit # systemctl restart visd.service
my-ppdm:/opt/emc/vmdirect/unit # systemctl status visd.service
● visd.service - VMDirect Infrastructure Services Daemon
Loaded: loaded (/usr/lib/systemd/system/visd.service; enabled; vendor preset: disabled)
Active: active (running) since Fri YYYY-04-21 09:42:38 PDT; 7s ago
Main PID: 67488 (visd)
Tasks: 16 (limit: 512)
Memory: 23.2M
CPU: 317ms
CGroup: /system.slice/visd.service
└─67488 /opt/emc/vmdirect/bin/visd -user admin -group app -p 9097 -nodemgmt -proxymgmt -vmdeployment -installclient -l
Apr 21 09:42:38 my-ppdm.my-domain.com systemd[1]: Started VMDirect Infrastructure Services Daemon.
Apr 21 09:42:38 my-ppdm.my-domain.com visd[67488]: INFO: Found GID 2000 (app) for group 'app'.
Apr 21 09:42:38 my-ppdm.my-domain.com visd[67488]: NOTICE: Effective group ID is set to 2000 (app).
Apr 21 09:42:38 my-ppdm.my-domain.com visd[67488]: INFO: Found UID 500 (admin) for user 'admin'.
Apr 21 09:42:38 my-ppdm.my-domain.com visd[67488]: NOTICE: Effective user ID is set to 500 (admin).
my-ppdm:/opt/emc/vmdirect/unit #