NVP - vProxy: A VM perde a conexão durante o processo de remoção do snapshot.
Summary: Durante a etapa de remoção de snapshot de um trabalho do vProxy, a máquina virtual (VM) de origem perde a conectividade temporariamente.
Symptoms
O log da sessão de backup do vProxy mostra quando as solicitações de snapshot são feitas:
YYYY/MM/DD HH:MM:SS TRACE: [NW_BUILD] Sending remove snapshot request to Snapshot Manager ... YYYY/MM/DD HH:MM:SS TRACE: [NW_BUILD] Sending remove snapshot request to Snapshot Manager ... YYYY/MM/DD HH:MM:SS INFO: [NW_BUILD] Remove snapshot request accepted by Snapshot Manager. YYYY/MM/DD HH:MM:SS INFO: [NW_BUILD] Remove snapshot request accepted by Snapshot Manager.
O vbackupd-snapmgr.log do vProxy pode apresentar um erro, por exemplo:
YYYY/MM/DD HH:MM:SS INFO: Found virtual machine "VM-NAME" with MORef "vm-###". YYYY/MM/DD HH:MM:SS NOTICE: Virtual machine "VM-NAME" requires consolidation of its virtual disks. YYYY/MM/DD HH:MM:SS ERROR: Failed to complete consolidation of virtual disks for "VM-NAME" (vm-###): Unable to access file since it is locked YYYY/MM/DD HH:MM:SS WARN: Failed to consolidate virtual disks of virtual machine "VM-NAME" (vm-###): Failed to complete consolidation of virtual disks for "VM-NAME" (vm-###): Unable to access file since it is locked. YYYY/MM/DD HH:MM:SS WARN: Failed to consolidate virtual disks of virtual machine "VM-NAME" (vm-###): Failed to complete consolidation of virtual disks for "VM-NAME" (vm-###): Unable to access file since it is locked. YYYY/MM/DD HH:MM:SS NOTICE: Snapshot "snapshot-###" of virtual machine "VM-NAME" (vm-###) was removed.
Os registros de eventos no sistema operacional da VM podem mostrar um erro, por exemplo:
The mirroring connection to "TCP://VM-NAME:5022" has timed out for database "out" after 10 seconds without a response. Check the service and network connections" Event ID: 1479.
O vmware.log da VM (encontrado na pasta do datastore VMware da VM) pode conter informações adicionais sobre o processo de remoção de snapshots.

Cause
A remoção de snapshots reduz a entrada/saída por segundo (IOPS) da VM. Isso acontece devido a bloqueios extras de armazenamento do VMFS (Virtual Machine File System) provenientes do aumento das atualizações de metadados e da carga de IOP adicionada durante o processo de remoção. Se o armazenamento de destino for executado acima de 30 a 40% da carga de IOP, a remoção do snapshot poderá empurrá-lo para além de 80%. Esse pico geralmente causa latência, prejudicando o desempenho dos aplicativos.
NVP vProxy: Solução de problemas de snapshot do VMware durante backups do NetWorker.
Resolution
Teste de isolamento:
Para isolar o problema para o evento específico de remoção de snapshot do VMware, siga as etapas abaixo:- Faça log-in no vCenter Server ou no vSphere Client.
- Crie um snapshot na VM em questão.
- Deixe o snapshot na VM por um período de tempo que um trabalho do vProxy executa na VM.
- Inicie um comando ping em relação ao endereço IP/nome de host da VM.
ping -D VM_IPWindows (PowerShell):
ping -t VM_IP | Foreach{"{0} - {1}" -f (Get-Date),$_} Ambos os comandos acima marcam o tempo do ping.
- Remova o snapshot.
- Observe a VM durante a remoção do snapshot.
Para VMs armazenadas em um datastore NFSv3:
Se você estiver fazendo backup de VMs armazenadas em um datastore NFSv3 e estiver observando problemas de conexão, consulte a KB da VMware: https://kb.vmware.com/s/article/2010953VMware relata esse problema específico como resolvido ao usar hosts do VMware ESXi 8.0u2b (ou mais recentes)
As opções a seguir estão disponíveis para soluções que usam NFSv3 para versões do ESXi anteriores à 8.0u2b. Uma das opções a seguir deve ser considerada.
- Implemente um equipamento vProxy NVP no mesmo host do ESXi que as VMs que estão sendo instaladas.
- Considere usar o protocolo NFSv4 para montar datastores NFS.
- Configure os equipamentos vProxy que fazem backup dessas VMs para usar NBD em vez de HotAdd. O uso de adição a quente sempre que possível é preferível, pois geralmente tem um desempenho melhor do que o NBD. A alta carga NBD pode afetar negativamente as redes de gerenciamento VMware. Essa opção só deve ser feita se as outras opções mencionadas não forem possíveis.
Additional Information
Solução de problemas adicional:
- Verifique se há snapshots na VM enquanto nenhum trabalho está em execução e remova todos os que forem encontrados.
- Verifique se há snapshots órfãos na VM.
- Reduza o número de backups simultâneos de VM que estão ocorrendo nesse datastore/host. Consulte o Guia de integração do NetWorker VMware para obter recomendações de desempenho e escalabilidade. https://www.dell.com/support/home/product-support/product/networker/docs
- Se os recursos de CPU da VM aumentarem muito durante a consolidação de snapshots, considere aumentar a reserva de CPU para essa VM.
- Mova a VM para um host com mais recursos disponíveis.
- Se a VM for o vCenter Server Appliances, consulte Best practices for vCenter Server backup and restore No Guia de integração do NetWorker VMware: https://www.dell.com/support/home/product-support/product/networker/docs
1002836 da base de conhecimento da VMware | A remoção de um snapshot pode interromper uma máquina virtual por um longo tempo.
Analise o pacote de suporte do VMware vCenter e colete os logs do sistema ESXi para os sistemas ESXi que hospedam VMs que observaram esse sintoma. O \var\run\log\vmkernel.log do host do ESXi pode mostrar problemas de latência de armazenamento durante as operações de snapshot:
YYYY-MM-DDTHH:mm:SS cpu10:2098132)WARNING: ScsiDeviceIO: 1498: Device naa.############# performance has deteriorated. I/O latency increased from average value of 1429 microseconds to 29874 microseconds.
O fornecedor de armazenamento deve ser envolvido para investigar mais.