PowerProtect: Резервні копії TSDM не працюють при ABV0016 на конкретному ESXi-хості
Summary: Політика захисту віртуальної машини (VM) стикається з періодичними збоями резервного копіювання під час запланованого виконання з критичним ідентифікатором повідомлення ABV0016.
Symptoms
ABV0016: VM Direct engine 'localhost' is unable to back up the virtual machine 'my-vm-name' on vCenter 'my-vcernter-name' because of a vCenter API issue. The VM Direct engine cannot complete the backup of this virtual machine because of a vCenter API operation did not complete successfully. To troubleshoot this issue: 1) Verify that the vCenter can be reached. 2) If the vCenter is busy, wait for some activities to complete and then retry the operation. 3) Verify that the virtual machine exists on the vCenter. Read Less Unable to create LWD snapshot. vCenter task 'task-#####' failed: VimFault: dp.vpx.fault.DpdThrottleLimitExceeded.summary'
YYYY-MM-DD HH:MM:SS TRACE: [a30a8b8946958a4e;8d8911578980c3ff] SDM Data Mover: SDM Full Sync: Closed file 'VM_Image_Daily_NON-SQL-uklpdtsbk001-f4723/PLCTLP-2832693c-377a-4f7e-952f-ffc1fdade2b1/Backups/c57b4143-f4c3-4760-86f5-7448429205ae/501efcd4-1f7e-5c9d-b98c-43633d01aa4c/lastSdmDiskBackupPath.json'. YYYY-MM-DD HH:MM:SS TRACE: [a30a8b8946958a4e;8d8911578980c3ff] SDM Data Mover: SDM Full Sync: Checking if the last path exists which was used as a baseline for each disk ... YYYY-MM-DD HH:MM:SS INFO: [a30a8b8946958a4e;8d8911578980c3ff] SDM Data Mover: SDM Full Sync: Full sync is not needed, skipping. YYYY-MM-DD HH:MM:SS TRACE: [a30a8b8946958a4e;8d8911578980c3ff] SDM Data Mover: Create LWD Snapshot: vCenter SOAP call 'DpSnapshot' was accepted. YYYY-MM-DD HH:MM:SS ERROR: [a30a8b8946958a4e;8d8911578980c3ff] SDM Data Mover: Create LWD Snapshot: The vCenter task failed: dp.vpx.fault.DpdThrottleLimitExceeded.summary YYYY-MM-DD HH:MM:SS ERROR: [a30a8b8946958a4e;8d8911578980c3ff] SDM Data Mover: Create LWD Snapshot: The vCenter task for 'Create SDM Snapshot' completed with state 'error'. YYYY-MM-DD HH:MM:SS ERROR: [a30a8b8946958a4e;8d8911578980c3ff] SDM Data Mover: Create LWD Snapshot: Unable to create SDM snapshot. YYYY-MM-DD HH:MM:SS TRACE: [a30a8b8946958a4e;8d8911578980c3ff] SDM Data Mover: Create LWD Snapshot: Retrying in 500ms... ... YYYY-MM-DD HH:MM:SS TRACE: [a30a8b8946958a4e;8d8911578980c3ff] SDM Data Mover: Create LWD Snapshot: vCenter SOAP call 'DpSnapshot' was accepted. YYYY-MM-DD HH:MM:SS ERROR: [a30a8b8946958a4e;8d8911578980c3ff] SDM Data Mover: Create LWD Snapshot: The vCenter task failed: dp.vpx.fault.DpdThrottleLimitExceeded.summary YYYY-MM-DD HH:MM:SS ERROR: [a30a8b8946958a4e;8d8911578980c3ff] SDM Data Mover: Create LWD Snapshot: The vCenter task for 'Create SDM Snapshot' completed with state 'error'. YYYY-MM-DD HH:MM:SS ERROR: [a30a8b8946958a4e;8d8911578980c3ff] SDM Data Mover: Create LWD Snapshot: Unable to create SDM snapshot. YYYY-MM-DD HH:MM:SS ERROR: [a30a8b8946958a4e;8d8911578980c3ff] SDM Data Mover: Create LWD Snapshot: Unsuccessful after 98 attempts over 1m0.158271936s. YYYY-MM-DD HH:MM:SS TRACE: [a30a8b8946958a4e;8d8911578980c3ff] SDM Data Mover: Snapshot failure can't be remedied by a Full sync.Веб-клієнт vSphere показує принаймні один ESXi-хост із безперервними помилками на основі LWD під час запланованого виконання.
Вивід vCenter Support bundle /var/log/vmware/vsan-health/vsanvcmgmtd-*.log показує, що ESXi-хост ідентифікується як спадковий DPD-хост:
YYYY-MM-DD HH:MM:SS warning vsanvcmgmtd[11593] [vSAN@6876 sub=dps] [opId=0849c23c] Found legacy DPD on host: host-29. Applying legacy throttle limit: '10', instead of regular throttle limit: '20'
Cause
Якщо кеш vCenter vSAN Health Service має застарілу версію або нульовий запис, він класифікує ESXi-хост як спадковий. Стандартний регулятор PowerProtect Data Manager надсилає 18 сесій резервного копіювання SDM на кожен ESXi-хост. Хост ESXi обробляє початкові 10 резервних копій SDM, але vCenter не витримає наступних резервних копій SDM, що свідчить про перевищення ліміту DPD.
Resolution
У vSphere 8.0 U1 є покращення, які автоматично оновлюють кеш служби vSAN Health у певних умовах. Рекомендується оновити версію до vSphere 8.0 U1, щоб скористатися цими покращеннями та запобігти певним симптомам, пов'язаним із кешом служби vSAN Health.
Обхідний шлях VMware:
Переконайтеся, що сервер vCenter і всі ESXi-хости кластера мають версію 7.0 U3d або новішу. Очистіть кеш, перезавантаживши сервіс vCenter Server Appliance (VCSA) vSAN Health через SSH-сесію:
service-control --restart vsan-health
За потреби звертайтеся до підтримки VMware для отримання додаткової інформації або допомоги щодо служби vSAN Health.
Additional Information
Обхідний шлях PowerProtect Data Manager:
У PowerProtect Data Manager є метод зменшення значення дроселя для TSDM-сесій резервного копіювання на всіх ESXi-хостах. Це можна використати як тимчасовий обхідний шлях під час оновлення ESXi-хостів або роботи з підтримкою VMware.
- Переконайтеся, що жодні захисні посади не працюють
- Увійдіть у PowerProtect Data Manager і підвищіть до sudo: sudo su -
- Зробіть копію файлу vmdirect.env: cp vmdirect.env vmdirect.env.orig
- Відкрите середовище vmdirect.env файл: vi /opt/emc/vmdirect/unit/vmdirect.env
- Змініть значення змінної середовища "MAX_SDM_BACKUP_SESSIONS_PER_HOST" на 10 (замість 18) і збережіть файл.
- Перезапустіть сервіс VISD :
systemctl restart visd.service
Приклад результату:
my-ppdm:/opt/emc/vmdirect/unit # cp vmdirect.env vmdirect.env.orig
my-ppdm:/opt/emc/vmdirect/unit # ls -l
total 20
-rwxr-xr-x 1 root root 397 Nov 2 22:48 visd.service
-rwxr-xr-x 1 root root 2225 Nov 2 22:48 vmdirect.env
-rwx------ 1 root root 2225 Apr 21 09:39 vmdirect.env.orig
-rwxr-xr-x 1 root root 360 Nov 2 22:48 vpod-nas.service
-rwxr-xr-x 1 root root 334 Nov 2 22:48 vpod.service
my-ppdm:/opt/emc/vmdirect/unit # vi vmdirect.env
my-ppdm:/opt/emc/vmdirect/unit # cat vmdirect.env | grep SDM
SDM_ENABLED_EXTERNAL_PROXIES=false
export SDM_ENABLED_EXTERNAL_PROXIES
MAX_SDM_SESSIONS_PER_HOST=20
export MAX_SDM_SESSIONS_PER_HOST
MAX_SDM_BACKUP_SESSIONS_PER_HOST=10
export MAX_SDM_BACKUP_SESSIONS_PER_HOST
MAX_ESX_SDM_TOTAL_DISKS=40
export MAX_ESX_SDM_TOTAL_DISKS
my-ppdm:/opt/emc/vmdirect/unit # systemctl restart visd.service
my-ppdm:/opt/emc/vmdirect/unit # systemctl status visd.service
● visd.service - VMDirect Infrastructure Services Daemon
Loaded: loaded (/usr/lib/systemd/system/visd.service; enabled; vendor preset: disabled)
Active: active (running) since Fri YYYY-04-21 09:42:38 PDT; 7s ago
Main PID: 67488 (visd)
Tasks: 16 (limit: 512)
Memory: 23.2M
CPU: 317ms
CGroup: /system.slice/visd.service
└─67488 /opt/emc/vmdirect/bin/visd -user admin -group app -p 9097 -nodemgmt -proxymgmt -vmdeployment -installclient -l
Apr 21 09:42:38 my-ppdm.my-domain.com systemd[1]: Started VMDirect Infrastructure Services Daemon.
Apr 21 09:42:38 my-ppdm.my-domain.com visd[67488]: INFO: Found GID 2000 (app) for group 'app'.
Apr 21 09:42:38 my-ppdm.my-domain.com visd[67488]: NOTICE: Effective group ID is set to 2000 (app).
Apr 21 09:42:38 my-ppdm.my-domain.com visd[67488]: INFO: Found UID 500 (admin) for user 'admin'.
Apr 21 09:42:38 my-ppdm.my-domain.com visd[67488]: NOTICE: Effective user ID is set to 500 (admin).
my-ppdm:/opt/emc/vmdirect/unit #