NVP-vProxy: VM mister forbindelsen under fjernelse af snapshot.
Summary: Under trinnet til fjernelse af snapshottet i et vProxy-job mister kildens virtuelle maskine (VM) midlertidigt forbindelsen.
Symptoms
VProxy-backupsessionsloggen viser, hvornår der anmodes om snapshots:
YYYY/MM/DD HH:MM:SS TRACE: [NW_BUILD] Sending remove snapshot request to Snapshot Manager ... YYYY/MM/DD HH:MM:SS TRACE: [NW_BUILD] Sending remove snapshot request to Snapshot Manager ... YYYY/MM/DD HH:MM:SS INFO: [NW_BUILD] Remove snapshot request accepted by Snapshot Manager. YYYY/MM/DD HH:MM:SS INFO: [NW_BUILD] Remove snapshot request accepted by Snapshot Manager.
vProxy-vbackupd-snapmgr.log kan vise en fejl, f.eks.:
YYYY/MM/DD HH:MM:SS INFO: Found virtual machine "VM-NAME" with MORef "vm-###". YYYY/MM/DD HH:MM:SS NOTICE: Virtual machine "VM-NAME" requires consolidation of its virtual disks. YYYY/MM/DD HH:MM:SS ERROR: Failed to complete consolidation of virtual disks for "VM-NAME" (vm-###): Unable to access file since it is locked YYYY/MM/DD HH:MM:SS WARN: Failed to consolidate virtual disks of virtual machine "VM-NAME" (vm-###): Failed to complete consolidation of virtual disks for "VM-NAME" (vm-###): Unable to access file since it is locked. YYYY/MM/DD HH:MM:SS WARN: Failed to consolidate virtual disks of virtual machine "VM-NAME" (vm-###): Failed to complete consolidation of virtual disks for "VM-NAME" (vm-###): Unable to access file since it is locked. YYYY/MM/DD HH:MM:SS NOTICE: Snapshot "snapshot-###" of virtual machine "VM-NAME" (vm-###) was removed.
Hændelseslogfiler på VM-operativsystemet kan vise en fejl, f.eks.:
The mirroring connection to "TCP://VM-NAME:5022" has timed out for database "out" after 10 seconds without a response. Check the service and network connections" Event ID: 1479.
VM'ens vmware.log (findes i VMware-datalagermappen fra VM'en) kan indeholde yderligere oplysninger om processen til fjernelse af snapshots.

Cause
Fjernelse af snapshot reducerer IOPS (Input/Output pr. sekund) for VM er. Dette sker på grund af ekstra VMFS-lagerlåse (Virtual Machine File System) fra øgede metadataopdateringer og tilføjet IOP-belastning under fjernelsesprocessen. Hvis destinationslageret kører over 30-40 % IOP-belastning, kan fjernelse af snapshots skubbe det over 80 %. Denne stigning forårsager ofte ventetid, hvilket skader applikationens ydeevne.
NVP vProxy: Fejlfinding af problemer med VMware-snapshots under NetWorker-sikkerhedskopieringer.
Resolution
Isolationstest:
Følg nedenstående trin for at isolere problemet til den specifikke hændelse til fjernelse af VMware-snapshot:- Log på vCenter-serveren eller vSphere-klienten.
- Opret et snapshot på den pågældende VM.
- Lad snapshottet blive på VM'en i et stykke tid, hvad et vProxy-job kører mod VM'en.
- Start en ping-kommando mod VM'ens IP-adresse/værtsnavn.
ping -D VM_IPWindows (Powershell):
ping -t VM_IP | Foreach{"{0} - {1}" -f (Get-Date),$_} Begge ovenstående kommandoer tidsstempler pingen.
- Fjern snapshottet.
- Hold øje med VM'en under fjernelsen af snapshottet.
For VM'er, der er gemt på et NFSv3-datalager:
Hvis du sikkerhedskopierer VM'er, der er gemt på et NFSv3-datalager og oplever forbindelsesproblemer, skal du se VMware KB: https://kb.vmware.com/s/article/2010953VMware rapporterer dette specifikke problem som løst, når du bruger VMware ESXi-værter, der er 8.0u2b (eller nyere)
Følgende indstillinger er tilgængelige for løsninger, der bruger NFSv3 til ESXi-versioner før 8.0u2b. En af følgende muligheder skal overvejes.
- Udrul en NVP vProxy-enhed på den samme ESXi-vært som de VM er, der bedøves.
- Overvej at bruge NFSv4-protokollen til montering af NFS-datalagre.
- Konfigurer de vProxy-enheder, som sikkerhedskopierer disse VM er, til at bruge NBD i stedet for HotAdd. Brug af varm tilføjelse, hvor det er muligt, foretrækkes, da det generelt fungerer bedre end NBD. Høj NBD-belastning kan påvirke VMware-administrationsnetværk negativt. Denne mulighed bør kun udføres, hvis de andre nævnte muligheder ikke er mulige.
Additional Information
Yderligere fejlfinding:
- Kontroller VM'en for snapshots, mens der ikke kører noget job, og fjern dem, der findes.
- Se efter forældreløse snapshots på VM'en.
- Reducer antallet af samtidige VM-sikkerhedskopieringer, der finder sted på det pågældende datalager/den pågældende vært. Se NetWorker VMware Integration Guide for anbefalinger til ydeevne og skalerbarhed. https://www.dell.com/support/home/product-support/product/networker/docs
- Hvis VM'ens CPU-ressourcer spidser kraftigt under snapshotkonsolidering, kan du overveje at øge CPU-reservationen for den pågældende VM.
- Flyt VM til en vært med flere tilgængelige ressourcer.
- Hvis VM er vCenter Server-enhederne, skal du se Bedste fremgangsmåder for sikkerhedskopiering og gendannelse af vCenter-server I NetWorker VMware-integrationsvejledningen: https://www.dell.com/support/home/product-support/product/networker/docs
VMware KB-1002836 | Fjernelse af snapshot kan stoppe en virtuel maskine i lang tid.
Gennemgå VMware vCenter-supportpakken, og sørg for at indsamle ESXi-systemlogfilerne for de ESXi-systemer, der er vært for VM er, som registrerede dette symptom. ESXi-værtens \var\run\log\vmkernel.log kan vise problemer med lagerventetiden under snapshothandlingerne:
YYYY-MM-DDTHH:mm:SS cpu10:2098132)WARNING: ScsiDeviceIO: 1498: Device naa.############# performance has deteriorated. I/O latency increased from average value of 1429 microseconds to 29874 microseconds.
Storageleverandøren skal inddrages for at undersøge sagen nærmere.