NVP-vProxy : La machine virtuelle perd la connexion pendant le processus de suppression du snapshot.
Summary: Au cours de l’étape de suppression des snapshots d’une tâche vProxy, la machine virtuelle (VM) source perd temporairement la connectivité.
Symptoms
Le journal de la session de sauvegarde vProxy s’affiche lorsque des demandes de snapshot sont effectuées :
YYYY/MM/DD HH:MM:SS TRACE: [NW_BUILD] Sending remove snapshot request to Snapshot Manager ... YYYY/MM/DD HH:MM:SS TRACE: [NW_BUILD] Sending remove snapshot request to Snapshot Manager ... YYYY/MM/DD HH:MM:SS INFO: [NW_BUILD] Remove snapshot request accepted by Snapshot Manager. YYYY/MM/DD HH:MM:SS INFO: [NW_BUILD] Remove snapshot request accepted by Snapshot Manager.
Le vbackupd-snapmgr.log vProxy peut afficher une erreur, par exemple :
YYYY/MM/DD HH:MM:SS INFO: Found virtual machine "VM-NAME" with MORef "vm-###". YYYY/MM/DD HH:MM:SS NOTICE: Virtual machine "VM-NAME" requires consolidation of its virtual disks. YYYY/MM/DD HH:MM:SS ERROR: Failed to complete consolidation of virtual disks for "VM-NAME" (vm-###): Unable to access file since it is locked YYYY/MM/DD HH:MM:SS WARN: Failed to consolidate virtual disks of virtual machine "VM-NAME" (vm-###): Failed to complete consolidation of virtual disks for "VM-NAME" (vm-###): Unable to access file since it is locked. YYYY/MM/DD HH:MM:SS WARN: Failed to consolidate virtual disks of virtual machine "VM-NAME" (vm-###): Failed to complete consolidation of virtual disks for "VM-NAME" (vm-###): Unable to access file since it is locked. YYYY/MM/DD HH:MM:SS NOTICE: Snapshot "snapshot-###" of virtual machine "VM-NAME" (vm-###) was removed.
Les journaux d’événements sur le système d’exploitation de la machine virtuelle peuvent afficher une erreur, par exemple :
The mirroring connection to "TCP://VM-NAME:5022" has timed out for database "out" after 10 seconds without a response. Check the service and network connections" Event ID: 1479.
Le vmware.log de la machine virtuelle (qui se trouve dans le dossier du datastore VMware de la machine virtuelle) peut contenir des informations supplémentaires sur le processus de suppression des snapshots.

Cause
La suppression de snapshots réduit les entrées/sorties par seconde (IOPS) des machines virtuelles. Cela se produit en raison de verrous de stockage VMFS (Virtual Machine File System) supplémentaires provenant de mises à jour de métadonnées accrues et d’une charge IOP supplémentaire lors du processus de suppression. Si le stockage cible s’exécute au-dessus de 30-40 % de charge d’E/S par seconde, la suppression de snapshot peut la pousser au-delà de 80 %. Ce pic entraîne souvent une latence qui nuit aux performances des applications.
NVP vProxy : Dépannage des problèmes de snapshot VMware lors des sauvegardes NetWorker.
Resolution
Test d’isolement :
Pour isoler le problème à l’événement spécifique de suppression de snapshot VMware, procédez comme suit :- Connectez-vous au vCenter Server ou au client vSphere.
- Créez un snapshot sur la machine virtuelle concernée.
- Conservez le snapshot sur la machine virtuelle pendant une durée d’exécution d’une tâche vProxy sur la machine virtuelle.
- Lancez une commande ping sur l’adresse IP/le nom d’hôte de la machine virtuelle.
ping -D VM_IPWindows (PowerShell) :
ping -t VM_IP | Foreach{"{0} - {1}" -f (Get-Date),$_} Les deux commandes ci-dessus horodatent le ping.
- Supprimez le snapshot.
- Observez la machine virtuelle lors de la suppression du snapshot.
Pour les machines virtuelles stockées sur un datastore NFSv3 :
Si vous sauvegardez des machines virtuelles stockées sur un datastore NFSv3 et que vous observez des problèmes de connexion, reportez-vous à la base de connaissances VMware : https://kb.vmware.com/s/article/2010953VMware signale ce problème spécifique comme résolu lors de l’utilisation d’hôtes VMware ESXi 8.0u2b (ou plus récents)
Les options suivantes sont disponibles pour les solutions utilisant NFSv3 pour les versions ESXi antérieures à 8.0u2b. L’une des options suivantes doit être envisagée.
- Déployez une appliance NVP vProxy sur le même hôte ESXi que les machines virtuelles en cours de Stupéfaction.
- Envisagez d’utiliser le protocole NFSv4 pour le montage des datastores NFS.
- Configurez les appliances vProxy qui sauvegardent ces machines virtuelles pour utiliser NBD au lieu de HotAdd. Il est préférable d’utiliser l’ajout à chaud dans la mesure du possible, car il est généralement plus performant que le NBD. Une charge NBD élevée peut avoir un impact négatif sur les réseaux de gestion VMware. Cette option ne doit être effectuée que si les autres options mentionnées ne sont pas possibles.
Additional Information
Dépannage supplémentaire :
- Recherchez des snapshots dans la machine virtuelle lorsqu’aucune tâche n’est en cours d’exécution et supprimez tous ceux qui ont été trouvés.
- Recherchez les snapshots orphelins sur la machine virtuelle.
- Réduisez le nombre de sauvegardes simultanées de machines virtuelles effectuées sur cet hôte ou magasin de données. Reportez-vous au Guide d’intégration de NetWorker VMware pour obtenir des recommandations en matière de performances et d’évolutivité. https://www.dell.com/support/home/product-support/product/networker/docs
- Si les ressources du processeur de la machine virtuelle augmentent fortement lors de la consolidation des snapshots, envisagez d’augmenter la réservation de processeur pour cette machine virtuelle.
- Déplacez la machine virtuelle vers un hôte disposant de plus de ressources disponibles.
- Si la machine virtuelle est vCenter Server Appliances, reportez-vous à la section Pratiques d’excellence pour la sauvegarde et la restauration de vCenter Server dans le Guide d’intégration de NetWorker VMware : https://www.dell.com/support/home/product-support/product/networker/docs
VMware KB 1002836 | La suppression d’un snapshot peut entraîner l’arrêt d’une machine virtuelle pendant une longue période.
Passez en revue le bundle de support VMware vCenter, assurez-vous de collecter les journaux système ESXi pour les systèmes ESXi qui hébergent les machines virtuelles qui ont observé ce symptôme. Le fichier \var\run\log\vmkernel.log de l’hôte ESXi peut présenter des problèmes de latence de stockage pendant les opérations de snapshot :
YYYY-MM-DDTHH:mm:SS cpu10:2098132)WARNING: ScsiDeviceIO: 1498: Device naa.############# performance has deteriorated. I/O latency increased from average value of 1429 microseconds to 29874 microseconds.
Le fournisseur de stockage doit être engagé pour effectuer une enquête plus approfondie.