NetWorker: Windows-Clientsystem-BugCheck-Ereignis verursacht Systemneustart während des Backups
Riepilogo: Der Windows-Clientrechner wird jedes Mal neu gestartet, wenn das Dateisystembackup initiiert wird. Custer-Umgebung. Beide Nodes haben dasselbe Problem.
Sintomi
Ein NetWorker-Dateisystembackup eines Windows-Hosts schlägt fehl.
Es gibt keine offensichtlichen Fehler in den NetWorker-Protokollen, die auf eine Ursache hinweisen:
181407:save: Step (1 of 5) for PID-10948: Save has been started on the client '<client-name>'. 174412:save: Step (2 of 5) for PID-10948: Running the backup on the client '<client-name>' for the save set 'pseudo_saveset'. 174424:save: Step (3 of 5) for PID-10948: Creating the snapshot for the selected save sets. --- Job Indications --- <client-name>:pseudo_saveset: retried 1 times.
184008 08/16/2023 02:30:58 AM 1 5 0 999192384 50244 0 <NetWorker-Server> savegrp NSR notice Client '<client-name>' is being skipped because no savesets of this client have been backed up as part of the backup action. 148758 08/16/2023 02:31:03 AM 1 5 0 999192384 50244 0 <NetWorker-Server> savegrp NSR notice Action backup traditional 'Backup' with job id 33079478 is exiting with status 'failed', exit code 1
Auf dem Windows-Client zeigen die Systemereignisprotokolle an, dass gleichzeitig ein BugCheck-Ereignis aufgetreten ist, wenn ein Backup geplant ist. Dieses Ereignis hat dazu geführt, dass der Clientcomputer neu gestartet wurde.
Dies wird nur während Backups angezeigt, für die der Volume Shadow Copy Service (VSS) aktiviert ist (Standard). Wenn der Windows-Client in NetWorker mit Speichervorgängen konfiguriert ist VSS:*=offklicken, ist das Backup erfolgreich.
Causa
Während der VSS-Snapshot-Erstellung können Dateisystemfiltertreiber im Kernelmodus von mehreren Sicherheitsprodukten gestapelt werden (z. B. Virenschutz (AV), HIPS, DLP, Festplattenverschlüsselung, EDR). Gleichzeitige Echtzeitfilter von zwei Virenschutzprodukten erhöhen die Nutzung des Kernel-Stacks während komplexer I/O-Pfade. Dies kann dazu führen, dass der Stapel erschöpft ist und ein BugCheck ausgelöst wird.
Risoluzione
Diagnoseprüfliste (vor Auswahl eines Lösungspfads erfassen)
- Erfassen Sie die BugCheck-Details:
Event Viewer → System → Ereignis-ID 1001 (BugCheck). Notieren Sie den STOP-Code und den fehlerhaften Treiber (z. B. xxx.sys), falls verfügbar.
Sammeln minidumps (%SystemRoot%\Minidump) enthalten.
- VSS-Integrität:
vssadmin list writers (suchen Sie nach "Stable with No error")vssadmin list providers
Überprüfen Sie die Anwendung Event Viewer → auf VSS (IDs 8193, 12293), VolSnap (z. B. 25) und defender/McAfee-Betriebsprotokolle zum Zeitpunkt des Vorfalls.
Weitere Informationen finden Sie unter: NetWorker: Troubleshooting von Backupfehlern aufgrund von VSS-Problemen
- Filtern Sie den Treiberstapel-Bestand:
fltmc (Dateisystemfilter, Treiber und Reihenfolge auflisten)
- Repro-Kontrolle: Vergewissern Sie sich, dass das Backup konsistent abgeschlossen wird mit
VSS:*=Off(stellt fest, dass der Absturz VSS-pfadspezifisch ist).

DISASTER_RECOVERY:\ Das Saveset wird nicht gesichert. Ein Backup ohne VSS wäre nicht BMR-konsistent.
Lösung (gestuft – minimale Unterbrechung bevorzugen)
A. Machen Sie VSS und NetWorker "AV-freundlich" (zuerst empfohlen)
- Ausschlüsse für Echtzeit-Scans (beide AV-Produkte ):
- Prozesse:
nsrexecd.exe,save.exe,savefs.exe,nsrsvc.exe(falls vorhanden) und alle NetWorker Helper-Binärdateien unterC:\Program Files\EMC NetWorker\nsr\bin\(oder Ihren Installationspfad). - Ordner:
C:\Program Files\EMC NetWorker\(gesamtnsrStruktur), temporäre NetWorker- und Cachepfade, falls angepasst. - VSS-Artefakte:
Ausschluss des Zugriffs auf\\?\GLOBALROOT\Device\HarddiskVolumeShadowCopy*und VSS-Staging-Speicherorte, um eine gründliche Überprüfung von Snapshot-Volumes während der Erstellung zu vermeiden.
- Prozesse:
- Verteidiger: Bevorzugen Sie den passiven Modus , wenn ein Virenschutz eines Drittanbieters den Echtzeitschutz verwaltet (mithilfe einer Policy oder einer Defender-Konfiguration). Dadurch bleibt EDR-Transparenz erhalten und gleichzeitig wird eine doppelte Echtzeitfilterkonfliktlösung vermieden.
- McAfee: Wenden Sie die empfohlenen Ausschlüsse von NetWorker/VSS an. Stellen Sie sicher, dass HIPS- oder DLP-Richtlinien keine Schattenkopien oder Blockkopien inspizieren.
volsnap/vssvc.
Ergebnis: Reduziert die Filteraktivität während VSS-Vorgängen und senkt den Druck auf den Kernel-Stack, ohne AV zu entfernen.
B. Reduzieren Sie die Treiber- und Filtertiefe während VSS.
- Deaktivieren Sie nicht wesentliche Endpunktmodule (HIPS, DLP, Gerätesteuerung) während Backup-Zeitfenstern gemäß Policy, wenn Ihr Sicherheitsteam dies genehmigt.
- Aktualisieren von AV-Treibern oder -Definitionen und kumulativen Windows VSS/VolSnap-Updates – veraltete Treiber tragen zu Ineffizienzen bei der Stack-Nutzung bei.
- Wenn ein VSS-Drittanbieter vorhanden ist, erzwingen Sie den Microsoft-Softwareschattenkopie-Anbieter (Auswirkungen auf den Test):
- Serviceprüfungen: Sicherstellen
Volume Shadow CopyDer Service ist fehlerfrei. - Deaktivieren oder entwirren Sie Anbieter, die nicht von Microsoft stammen, wenn bekannt ist, dass sie miteinander in Konflikt stehen (in Abstimmung mit der Plattform oder dem Sicherheitsteam).
- Serviceprüfungen: Sicherstellen
C. Planung und Lastminderung
- Führen Sie Backups außerhalb der Spitzenauslastung durch (intensive I/O, Scans oder Endpunktaufgaben).
- Staffeln Sie Jobs, sodass weniger Clients gleichzeitig VSS-Snapshots auslösen, wenn zentrale Policies synchronisierte Scans verursachen.
D. Letzter Ausweg (vermeiden, es sei denn, es ist vorgeschrieben)
- Wählen Sie ein Echtzeit-AV-Produkt aus . Wenn die Richtlinie dies zulässt, setzen Sie Defender auf den passiven/EDR-Modus oder deaktivieren Sie Echtzeit vollständig, wenn McAfee der primäre Virenschutz ist.
Die Deinstallation eines Virenschutzes sollte ein letzter Schritt sein, nicht die Standardempfehlung.
E. Betriebliche Problemumgehung (wenn geschäftliche Anforderungen außer Kraft setzen)
- Fortsetzen von Backups mit
VSS:*=Offvorübergehend , wenn das Konsistenzrisiko für die betroffene Workload akzeptabel ist. Dokumentieren Sie, dass die Anwendungskonsistenz auf VSS-Ebene (Writer) reduziert werden kann (z. B. durch Öffnen von Dateien). Verwenden Sie diese Option nur für nicht kritische Datenvolumen, während die Korrektur fortgesetzt wird.
Überprüfung:
- Führen Sie nach dem Anwenden von Ausnahmen und Treiberoptimierungen Folgendes aus:
vssadmin list writers→ bestätigenStable- Testen eines manuellen Snapshots:
wmic shadowcopy call create Volume='C:\'(Überwachen von Ereignissen für Fehlerprüfungen) - Ausführen eines NetWorker-Dateisystembackups auf einem einzigen Volume Skalieren Sie dann nach oben.
- Bestätigen Sie , dass kein BugCheck vorhanden ist, und der Job wird mit aktiviertem VSS abgeschlossen.