NVP-vProxy: La VM pierde la conexión durante el proceso de eliminación de instantáneas.
Summary: Durante el paso de eliminación de instantáneas de un trabajo de vProxy, la máquina virtual (VM) de origen pierde conectividad temporalmente.
Symptoms
El registro de la sesión de respaldo de vProxy muestra cuándo se realizan solicitudes de instantánea:
YYYY/MM/DD HH:MM:SS TRACE: [NW_BUILD] Sending remove snapshot request to Snapshot Manager ... YYYY/MM/DD HH:MM:SS TRACE: [NW_BUILD] Sending remove snapshot request to Snapshot Manager ... YYYY/MM/DD HH:MM:SS INFO: [NW_BUILD] Remove snapshot request accepted by Snapshot Manager. YYYY/MM/DD HH:MM:SS INFO: [NW_BUILD] Remove snapshot request accepted by Snapshot Manager.
El vbackupd-snapmgr.log vProxy puede mostrar un error, por ejemplo:
YYYY/MM/DD HH:MM:SS INFO: Found virtual machine "VM-NAME" with MORef "vm-###". YYYY/MM/DD HH:MM:SS NOTICE: Virtual machine "VM-NAME" requires consolidation of its virtual disks. YYYY/MM/DD HH:MM:SS ERROR: Failed to complete consolidation of virtual disks for "VM-NAME" (vm-###): Unable to access file since it is locked YYYY/MM/DD HH:MM:SS WARN: Failed to consolidate virtual disks of virtual machine "VM-NAME" (vm-###): Failed to complete consolidation of virtual disks for "VM-NAME" (vm-###): Unable to access file since it is locked. YYYY/MM/DD HH:MM:SS WARN: Failed to consolidate virtual disks of virtual machine "VM-NAME" (vm-###): Failed to complete consolidation of virtual disks for "VM-NAME" (vm-###): Unable to access file since it is locked. YYYY/MM/DD HH:MM:SS NOTICE: Snapshot "snapshot-###" of virtual machine "VM-NAME" (vm-###) was removed.
Los registros de eventos en el sistema operativo de la máquina virtual pueden mostrar un error, por ejemplo:
The mirroring connection to "TCP://VM-NAME:5022" has timed out for database "out" after 10 seconds without a response. Check the service and network connections" Event ID: 1479.
El vmware.log de la VM (que se encuentra en la carpeta del almacén de datos de VMware de la VM) puede contener información adicional sobre el proceso de eliminación de instantáneas.

Cause
La eliminación de instantáneas reduce la entrada/salida por segundo (IOPS) de las VM. Esto sucede debido a bloqueos de almacenamiento adicionales del sistema de archivos de máquina virtual (VMFS) debido a mayores actualizaciones de metadatos y carga de IOP agregada durante el proceso de eliminación. Si el almacenamiento objetivo se ejecuta por encima del 30-40 % de carga de IOP, la eliminación de instantáneas puede llevarla más allá del 80 %. Este pico suele provocar latencia, lo que perjudica el rendimiento de las aplicaciones.
Proxy de NVP vProxy: Solución de problemas de instantáneas de VMware durante los respaldos de NetWorker.
Resolution
Pruebas de aislamiento:
Para aislar el problema al evento específico de eliminación de instantáneas de VMware, siga los pasos que se indican a continuación:- Inicie sesión en vCenter Server o vSphere Client.
- Cree una instantánea en la VM en cuestión.
- Deje la instantánea en la VM durante un tiempo que se ejecuta un trabajo de vProxy en la VM.
- Inicie un comando ping en la dirección IP o el nombre de host de la VM.
ping -D VM_IPWindows (Powershell):
ping -t VM_IP | Foreach{"{0} - {1}" -f (Get-Date),$_} Los dos comandos anteriores marcan la hora del ping.
- Elimine la instantánea.
- Observe la VM durante la eliminación de instantáneas.
Para las VM almacenadas en un almacén de datos NFSv3:
Si está respaldando máquinas virtuales almacenadas en un almacén de datos NFSv3 y observa problemas de conexión, consulte la base de conocimientos de VMware: https://kb.vmware.com/s/article/2010953VMware informa este problema específico como resuelto cuando se utilizan hosts VMware ESXi 8.0u2b (o más recientes)
Las siguientes opciones están disponibles para las soluciones que utilizan NFSv3 para las versiones ESXi anteriores a 8.0u2b. Se debe considerar una de las siguientes opciones.
- Implemente un dispositivo vProxy NVP en el mismo host ESXi que las VM que se están afectando.
- Considere el uso del protocolo NFSv4 para montar almacenes de datos NFS.
- Configure los dispositivos vProxy que respaldan estas VM para utilizar NBD en lugar de adición en caliente. Siempre que sea posible, se recomienda usar la adición en caliente, ya que generalmente funciona mejor que NBD. Una carga alta de NBD puede afectar negativamente las redes de administración de VMware. Esta opción solo se debe realizar si las otras opciones mencionadas no son posibles.
Additional Information
Solución de problemas adicionales:
- Busque instantáneas en la máquina virtual mientras no hay ningún trabajo en ejecución y elimine las que se encuentren.
- Compruebe si hay instantáneas huérfanas en la máquina virtual.
- Reduzca la cantidad de respaldos simultáneos de VM que se producen en ese almacén de datos/host. Consulte la Guía de integración de VMware de NetWorker para obtener recomendaciones de rendimiento y escalabilidad. https://www.dell.com/support/home/product-support/product/networker/docs
- Si los recursos de CPU de la VM tienen un gran aumento durante la consolidación de instantáneas, considere aumentar la reserva de CPU para esa VM.
- Mueva la VM a un host con más recursos disponibles.
- Si la VM es vCenter Server Appliances, consulte Prácticas recomendadas para el respaldo y la restauración de vCenter Server en la Guía de integración de VMware de NetWorker: https://www.dell.com/support/home/product-support/product/networker/docs
1002836 de la base de conocimientos de VMware | La eliminación de una instantánea puede detener una máquina virtual durante mucho tiempo.
Revise el paquete de soporte de VMware vCenter y asegúrese de recolectar los registros del sistema ESXi para los sistemas ESXi que alojan las máquinas virtuales que observaron este síntoma. \var\run\log\vmkernel.log del host ESXi puede mostrar problemas de latencia de almacenamiento durante las operaciones de instantánea:
YYYY-MM-DDTHH:mm:SS cpu10:2098132)WARNING: ScsiDeviceIO: 1498: Device naa.############# performance has deteriorated. I/O latency increased from average value of 1429 microseconds to 29874 microseconds.
Se debe involucrar al proveedor de almacenamiento para investigar más a fondo.