NVP-vProxy: Maszyna wirtualna traci połączenie podczas usuwania migawki.
Summary: Podczas etapu usuwania migawki zadania vProxy źródłowa maszyna wirtualna tymczasowo traci łączność.
Symptoms
Dziennik sesji kopii zapasowej vProxy pokazuje, kiedy wysyłane są żądania migawki:
YYYY/MM/DD HH:MM:SS TRACE: [NW_BUILD] Sending remove snapshot request to Snapshot Manager ... YYYY/MM/DD HH:MM:SS TRACE: [NW_BUILD] Sending remove snapshot request to Snapshot Manager ... YYYY/MM/DD HH:MM:SS INFO: [NW_BUILD] Remove snapshot request accepted by Snapshot Manager. YYYY/MM/DD HH:MM:SS INFO: [NW_BUILD] Remove snapshot request accepted by Snapshot Manager.
W vbackupd-snapmgr.log vProxy może pojawić się błąd, na przykład:
YYYY/MM/DD HH:MM:SS INFO: Found virtual machine "VM-NAME" with MORef "vm-###". YYYY/MM/DD HH:MM:SS NOTICE: Virtual machine "VM-NAME" requires consolidation of its virtual disks. YYYY/MM/DD HH:MM:SS ERROR: Failed to complete consolidation of virtual disks for "VM-NAME" (vm-###): Unable to access file since it is locked YYYY/MM/DD HH:MM:SS WARN: Failed to consolidate virtual disks of virtual machine "VM-NAME" (vm-###): Failed to complete consolidation of virtual disks for "VM-NAME" (vm-###): Unable to access file since it is locked. YYYY/MM/DD HH:MM:SS WARN: Failed to consolidate virtual disks of virtual machine "VM-NAME" (vm-###): Failed to complete consolidation of virtual disks for "VM-NAME" (vm-###): Unable to access file since it is locked. YYYY/MM/DD HH:MM:SS NOTICE: Snapshot "snapshot-###" of virtual machine "VM-NAME" (vm-###) was removed.
Dzienniki zdarzeń w systemie operacyjnym maszyny wirtualnej mogą pokazywać błąd, na przykład:
The mirroring connection to "TCP://VM-NAME:5022" has timed out for database "out" after 10 seconds without a response. Check the service and network connections" Event ID: 1479.
vmware.log maszyny wirtualnej (znajdujący się w folderze magazynu danych VMware z maszyny wirtualnej) może zawierać dodatkowe informacje na temat procesu usuwania migawki.

Cause
Usunięcie migawki zmniejsza liczbę operacji wejścia/wyjścia maszyny wirtualnej na sekundę (IOPS). Dzieje się tak z powodu dodatkowych blokad pamięci masowej VMFS (Virtual Machine File System) spowodowanych zwiększonymi aktualizacjami metadanych i dodatkowym obciążeniem IOP podczas procesu usuwania. Jeśli docelowy magazyn przekroczy 30–40% obciążenia IOP, usunięcie migawki może przekroczyć 80%. Ten skok często powoduje opóźnienia, szkodząc wydajności aplikacji.
NVP vProxy: Rozwiązywanie problemów z migawkami VMware podczas tworzenia kopii zapasowych NetWorker.
Resolution
Testowanie izolacji:
Aby przypisać problem do konkretnego zdarzenia usuwania migawki VMware, wykonaj następujące czynności:- Zaloguj się do serwera vCenter Server lub klienta vSphere.
- Utwórz migawkę na danej maszynie wirtualnej.
- Pozostaw migawkę na maszynie wirtualnej na czas, który zadanie vProxy uruchamia dla maszyny wirtualnej.
- Zainicjuj polecenie ping względem adresu IP/nazwy hosta maszyny wirtualnej.
ping -D VM_IPWindows (PowerShell):
ping -t VM_IP | Foreach{"{0} - {1}" -f (Get-Date),$_} Oba powyższe polecenia oznaczają ping znacznikiem czasu.
- Usuń migawkę.
- Zaobserwuj maszynę wirtualną podczas usuwania migawki.
W przypadku maszyn wirtualnych przechowywanych w magazynie danych NFSv3:
W przypadku tworzenia kopii zapasowych maszyn wirtualnych przechowywanych w magazynie danych NFSv3 i obserwowanych są problemy z połączeniem, zapoznaj się z artykułem bazy wiedzy VMware: https://kb.vmware.com/s/article/2010953VMware zgłasza ten konkretny problem jako rozwiązany podczas korzystania z hostów VMware ESXi z oprogramowaniem 8.0u2b (lub nowszym)
Poniższe opcje są dostępne dla rozwiązań korzystających z NFSv3 dla wersji ESXi starszej niż 8.0u2b. Należy rozważyć jedną z następujących opcji.
- Wdróż urządzenie NVP vProxy na tym samym hoście ESXi co maszyny wirtualne, które są ogłuszane.
- Rozważ użycie protokołu NFSv4 do montowania magazynów danych NFS.
- Skonfiguruj urządzenia vProxy, które tworzą kopie zapasowe tych maszyn wirtualnych, aby używały NBD zamiast HotAdd. Preferowane jest używanie dodawania na gorąco, gdy tylko jest to możliwe, ponieważ generalnie działa lepiej niż NBD. Duże obciążenie w następnym dniu roboczym może mieć negatywny wpływ na sieci zarządzania VMware. Ta opcja powinna być wykonywana tylko wtedy, gdy inne wymienione opcje nie są możliwe.
Additional Information
Dodatkowe sposoby rozwiązywania problemów:
- Sprawdź maszynę wirtualną pod kątem migawek, gdy żadne zadanie nie jest uruchomione, i usuń wszystkie, które zostały znalezione.
- Sprawdź oddzielone migawki na maszynie wirtualnej.
- Zmniejsz liczbę równoczesnych kopii zapasowych maszyn wirtualnych, które mają miejsce w tym magazynie danych/hoście. Zalecenia dotyczące wydajności i skalowalności można znaleźć w Podręczniku integracji NetWorker VMware. https://www.dell.com/support/home/product-support/product/networker/docs
- Jeśli zasoby procesora CPU maszyny wirtualnej znacznie wzrosły podczas konsolidacji migawki, rozważ zwiększenie rezerwacji procesora CPU dla tej maszyny wirtualnej.
- Przenieś maszynę wirtualną do hosta z większą liczbą dostępnych zasobów.
- Jeśli maszyna wirtualna to vCenter Server Appliance, zobacz Najlepsze praktyki dotyczące tworzenia kopii zapasowych i przywracania systemu vCenter Server w Podręczniku integracji NetWorker VMware: https://www.dell.com/support/home/product-support/product/networker/docs
Bazy wiedzy VMware 1002836 | Usunięcie migawki może zatrzymać maszynę wirtualną na długi czas.
Przejrzyj pakiet pomocy technicznej VMware vCenter i zbierz dzienniki systemowe ESXi dla systemów ESXi hostujących maszyny wirtualne, na których zaobserwowano ten objaw. \var\run\log\vmkernel.log hosta ESXi może wykazywać problemy z opóźnieniem pamięci masowej podczas operacji migawki:
YYYY-MM-DDTHH:mm:SS cpu10:2098132)WARNING: ScsiDeviceIO: 1498: Device naa.############# performance has deteriorated. I/O latency increased from average value of 1429 microseconds to 29874 microseconds.
Aby dokładniej zbadać sprawę, należy zaangażować dostawcę pamięci masowej.