NetWorker : L’événement BugCheck du système client Windows provoque le redémarrage du système pendant la sauvegarde
Riepilogo: La machine client Windows redémarre chaque fois que la sauvegarde du système de fichiers est lancée. Environnement Custer. Les deux nœuds rencontrent le même problème.
Sintomi
Une sauvegarde du système de fichiers NetWorker d’un hôte Windows échoue.
Il n’y a pas d’erreurs évidentes indiquant une cause dans les logs NetWorker :
181407:save: Step (1 of 5) for PID-10948: Save has been started on the client '<client-name>'. 174412:save: Step (2 of 5) for PID-10948: Running the backup on the client '<client-name>' for the save set 'pseudo_saveset'. 174424:save: Step (3 of 5) for PID-10948: Creating the snapshot for the selected save sets. --- Job Indications --- <client-name>:pseudo_saveset: retried 1 times.
184008 08/16/2023 02:30:58 AM 1 5 0 999192384 50244 0 <NetWorker-Server> savegrp NSR notice Client '<client-name>' is being skipped because no savesets of this client have been backed up as part of the backup action. 148758 08/16/2023 02:31:03 AM 1 5 0 999192384 50244 0 <NetWorker-Server> savegrp NSR notice Action backup traditional 'Backup' with job id 33079478 is exiting with status 'failed', exit code 1
Sur le client Windows, les journaux d’événements système indiquent qu’un événement BugCheck s’est produit simultanément lors de la planification d’une sauvegarde. Cet événement provoquait le redémarrage de la machine cliente.
Cela s’affiche uniquement lors des sauvegardes du service VSS (Volume Shadow Copy Service) activées (par défaut). Si le client Windows est configuré dans NetWorker avec les opérations de sauvegarde VSS:*=off, la sauvegarde réussit.
Causa
Lors de la création d’un snapshot VSS, les pilotes de filtre du système de fichiers en mode noyau de plusieurs produits de sécurité peuvent s’empiler (par exemple, antivirus (AV), HIPS, DLP, chiffrement de disque, EDR). Les filtres en temps réel simultanés de deux produits antivirus augmentent l’utilisation de la pile de noyaux lors des entrées/sorties complexes. Cela peut épuiser la pile et déclencher un BugCheck.
Risoluzione
Check-list de diagnostic (collecte avant de choisir un chemin de résolution)
- Capturez les détails de BugCheck :
Observateur d’événements → système → ID d’événement 1001 (BugCheck). Enregistrez le code d’arrêt et la défaillance du conducteur (par exemple, xxx.sys) s’ils sont disponibles.
Recueillir minidumps (%SystemRoot%\Minidump).
- Intégrité VSS :
vssadmin list writers (recherchez Stable with No error)vssadmin list providers
Vérifiez l’application → l’observateur d’événements pour VSS (ID 8193, 12293), VolSnap (par exemple, 25) et les journaux opérationnels Defender/McAfee au moment de l’incident.
Pour plus d’informations, consultez : NetWorker : Dépannage des échecs de sauvegarde dus à des problèmes VSS
- Filtrer l’inventaire des piles de pilotes :
fltmc (répertorier les systèmes de fichiers, filtrer, pilotes et ordre)
- Contrôle de reproduction : Vérifiez que la sauvegarde se termine de manière cohérente avec
VSS:*=Off(établit que la panne est spécifique au chemin VSS).

DISASTER_RECOVERY:\ Le saveset n’est pas sauvegardé. Une sauvegarde sans VSS ne serait pas cohérente avec les opérations BMR.
Résolution (hiérarchisée, préférez le moins d’interruptions possible)
A. Rendre VSS et NetWorker « AV-friendly » (recommandé en premier)
- Exclusions d’analyse en temps réel (les deux produits AV) :
- Procédés :
nsrexecd.exe,save.exe,savefs.exe,nsrsvc.exe(le cas échéant) et tous les fichiers binaires de l’assistant NetWorker sousC:\Program Files\EMC NetWorker\nsr\bin\(ou votre chemin d’installation). - Dossiers :
C:\Program Files\EMC NetWorker\(Intégraliténsrd’arborescence), les chemins temporaires NetWorker et de cache s’ils sont personnalisés. - Artefacts VSS :
Exclure l’accès à\\?\GLOBALROOT\Device\HarddiskVolumeShadowCopy*et des emplacements de transit VSS pour éviter une inspection approfondie des volumes de snapshots lors de la création.
- Procédés :
- Défenseur : Privilégiez le mode passif lorsqu’un antivirus tiers gère la protection en temps réel (à l’aide d’une stratégie ou d’une configuration Defender). Cela permet de conserver la visibilité EDR tout en évitant les conflits d’accès à deux filtres en temps réel.
- McAfee : Appliquer les exclusions recommandées par NetWorker/VSS ; Assurez-vous que les règles HIPS ou DLP n’inspectent pas les clichés instantanés ou les blocs
volsnap/vssvc.
Résultat : Réduit l’activité du filtre pendant les opérations VSS et diminue la pression de la pile des noyaux sans retirer AV.
B. Réduisez la profondeur du pilote et du filtre pendant VSS.
- Désactivez temporairement les modules de point de terminaison non essentiels (HIPS, DLP, contrôle des appareils) pendant les fenêtres de sauvegarde par règle si votre équipe de sécurité l’approuve.
- Mettez à jour les pilotes ou définitions AV et les mises à jour cumulatives Windows VSS/VolSnap : les pilotes obsolètes contribuent à réduire l’efficacité de l’utilisation de la pile.
- Si un fournisseur VSS tiers est présent, forcez le fournisseur Microsoft Software Shadow Copy (impact du test) :
- Vérifications de service : Assurer
Volume Shadow CopyLe service est sain. - Désactivez ou démêlez les fournisseurs non Microsoft s’ils sont connus pour être en conflit (en coordination avec la plate-forme ou l’équipe de sécurité).
- Vérifications de service : Assurer
C. Planification et atténuation de la charge
- Exécutez les sauvegardes en dehors des pics d’activité (E/S intensives, analyses ou tâches de point de terminaison).
- Échelonner les tâches afin que moins de clients déclenchent simultanément un snapshot VSS si les règles centrales provoquent des analyses synchronisées.
D. Dernier recours (à éviter à moins que cela ne soit obligatoire)
- Choisissez un produit AV en temps réel . Si la règle le permet, configurez Defender en mode passif/EDR uniquement ou désactivez-le entièrement en temps réel lorsque McAfee est l’antivirus principal.
La désinstallation d’un antivirus doit être une dernière étape, et non la recommandation par défaut.
E. Solution de contournement opérationnelle (si l’entreprise a besoin d’une dérogation)
- Continuez les sauvegardes avec
VSS:*=OffTemporairement , si le risque de cohérence est acceptable pour la charge applicative affectée. Documentez le fait que la cohérence des applications au niveau VSS (rédacteurs) peut être réduite (par exemple, fichiers ouverts). À utiliser uniquement pour les jeux de données non critiques pendant la mesure corrective.
Vérification
- Après avoir appliqué des exclusions et des optimisations de pilotes, exécutez :
vssadmin list writers→ confirmerStable- Tester un snapshot manuel :
wmic shadowcopy call create Volume='C:\'(surveiller les événements pour les vérifications de bogues) - Exécutez une sauvegarde du système de fichiers NetWorker sur un seul volume ; Puis, passez à la vitesse supérieure.
- Confirmez qu’il n’y a pas de BugCheck et que la tâche se termine avec VSS activé.