NVP-vProxy: VM втрачає з'єднання під час процесу видалення знімків.
Summary: Під час етапу видалення знімків завдання vProxy вихідна віртуальна машина (VM) тимчасово втрачає зв'язок.
Symptoms
Журнал сесії резервного копіювання vProxy показує, коли робляться запити на знімок:
YYYY/MM/DD HH:MM:SS TRACE: [NW_BUILD] Sending remove snapshot request to Snapshot Manager ... YYYY/MM/DD HH:MM:SS TRACE: [NW_BUILD] Sending remove snapshot request to Snapshot Manager ... YYYY/MM/DD HH:MM:SS INFO: [NW_BUILD] Remove snapshot request accepted by Snapshot Manager. YYYY/MM/DD HH:MM:SS INFO: [NW_BUILD] Remove snapshot request accepted by Snapshot Manager.
vbackupd-snapmgr.log vProxy може показувати помилку, наприклад:
YYYY/MM/DD HH:MM:SS INFO: Found virtual machine "VM-NAME" with MORef "vm-###". YYYY/MM/DD HH:MM:SS NOTICE: Virtual machine "VM-NAME" requires consolidation of its virtual disks. YYYY/MM/DD HH:MM:SS ERROR: Failed to complete consolidation of virtual disks for "VM-NAME" (vm-###): Unable to access file since it is locked YYYY/MM/DD HH:MM:SS WARN: Failed to consolidate virtual disks of virtual machine "VM-NAME" (vm-###): Failed to complete consolidation of virtual disks for "VM-NAME" (vm-###): Unable to access file since it is locked. YYYY/MM/DD HH:MM:SS WARN: Failed to consolidate virtual disks of virtual machine "VM-NAME" (vm-###): Failed to complete consolidation of virtual disks for "VM-NAME" (vm-###): Unable to access file since it is locked. YYYY/MM/DD HH:MM:SS NOTICE: Snapshot "snapshot-###" of virtual machine "VM-NAME" (vm-###) was removed.
Журнали подій на операційній системі VM можуть показувати помилку, наприклад:
The mirroring connection to "TCP://VM-NAME:5022" has timed out for database "out" after 10 seconds without a response. Check the service and network connections" Event ID: 1479.
vmware.log віртуальної машини (знайдена у папці сховища даних VMware) може містити додаткову інформацію про процес видалення знімків.

Cause
Видалення знімків зменшує вхід/вивід VM за секунду (IOPS). Це відбувається через додаткові блокування пам'яті Virtual Machine File System (VMFS) через збільшення оновлень метаданих та додаткове навантаження на IOP під час процесу видалення. Якщо цільове сховище перевищує 30–40% навантаження IOP, видалення знімків може перевищити 80%. Цей стрибок часто спричиняє затримку, що шкодить продуктивності
застосування.NVP vProxy: Вирішення проблем із VMware Snapshot під час резервного копіювання NetWorker.
Resolution
Ізоляційне тестування:
Щоб ізолювати проблему від конкретної події видалення знімків VMware, виконайте наступні кроки:- Увійдіть на сервер vCenter або клієнт vSphere.
- Створіть знімок на відповідній віртуальній машині.
- Залиште знімок на віртуальній машині на певний час, який vProxy виконує проти віртуальної машини.
- Ініціюйте команду ping на IP-адресу/ім'я хоста віртуальної машини.
ping -D VM_IPWindows (Powershell):
ping -t VM_IP | Foreach{"{0} - {1}" -f (Get-Date),$_} Обидві вищезазначені команди позначають пінг за часом.
- Видаліть знімок.
- Спостерігайте за віртуальною машиною під час видалення знімка.
Для віртуальних машин, збережених у сховищі даних NFSv3:
Якщо ви робите резервне копіювання віртуальних машин, які зберігаються у сховищі даних NFSv3, і спостерігаєте проблеми з підключенням, дивіться VMware KB: https://kb.vmware.com/s/article/2010953VMware повідомляє про цю конкретну проблему як вирішену при використанні хостів VMware ESXi з версіями 8.0u2b (або новішими).
Наступні опції доступні для рішень, що використовують NFSv3 для версій ESXi до 8.0u2b. Слід розглянути один із наступних варіантів.
- Розгорніть пристрій NVP vProxy на тому ж ESXi-хості, що й віртуальні машини, які піддаються оглушенню.
- Розгляньте використання протоколу NFSv4 для монтування NFS-сховищ даних.
- Налаштуйте пристрої vProxy, які роблять резервне копіювання цих віртуальних машин, щоб використовувати NBD замість HotAdd. Бажано використовувати гаряче додавання, де це можливо, оскільки воно зазвичай працює краще за NBD. Високе навантаження на NBD може негативно впливати на мережі управління VMware. Цей варіант слід застосовувати лише у випадку, якщо інші варіанти неможливі.
Additional Information
Додаткове усунення несправностей:
- Перевірте віртуальну машину на наявність знімків, коли жодна робота не виконується, і видаліть знайдені зображення.
- Перевірте наявність сиротливих знімків у віртуальній машині.
- Зменшити кількість одночасних резервних копій віртуальних машин, які відбуваються на цьому сховищі даних/хості. Дивіться NetWorker VMware Integration Guide для рекомендацій щодо продуктивності та масштабованості. https://www.dell.com/support/home/product-support/product/networker/docs
- Якщо ресурси процесора VM різко зростають під час консолідації Snapshot, розгляньте можливість збільшення резервування процесора для цієї VM.
- Перенесіть віртуальну машину на хост з більшою кількістю доступних ресурсів.
- Якщо віртуальна машина — це серверні пристрої vCenter, дивіться Найкращі практики резервного копіювання та відновлення серверів vCenter у Посібнику з інтеграції VMware NetWorker: https://www.dell.com/support/home/product-support/product/networker/docs
VMware KB 1002836 | Видалення знімка може зупинити віртуальну машину на тривалий час.
Перегляньте пакет підтримки VMware vCenter, переконайтеся, що ви зібрали логи ESXi систем для ESXi, які хостили віртуальні машини, що спостерігали цей симптом. \var\run\log\vmkernel.log хоста ESXi може показувати проблеми із затримкою зберігання під час операцій знімка:
YYYY-MM-DDTHH:mm:SS cpu10:2098132)WARNING: ScsiDeviceIO: 1498: Device naa.############# performance has deteriorated. I/O latency increased from average value of 1429 microseconds to 29874 microseconds.
Постачальник зберігання має бути залучений для подальшого розслідування.