NetWorker: L'evento BugCheck del sistema client Windows causa il riavvio del sistema durante il backup
Riepilogo: Il computer client Windows viene riavviato ogni volta che viene avviato il backup del file system. Ambiente di Custer. Entrambi i nodi hanno lo stesso problema.
Sintomi
Un backup del file system NetWorker di un host Windows ha esito negativo.
Non sono presenti errori evidenti che indichino la causa nei registri di NetWorker:
181407:save: Step (1 of 5) for PID-10948: Save has been started on the client '<client-name>'. 174412:save: Step (2 of 5) for PID-10948: Running the backup on the client '<client-name>' for the save set 'pseudo_saveset'. 174424:save: Step (3 of 5) for PID-10948: Creating the snapshot for the selected save sets. --- Job Indications --- <client-name>:pseudo_saveset: retried 1 times.
184008 08/16/2023 02:30:58 AM 1 5 0 999192384 50244 0 <NetWorker-Server> savegrp NSR notice Client '<client-name>' is being skipped because no savesets of this client have been backed up as part of the backup action. 148758 08/16/2023 02:31:03 AM 1 5 0 999192384 50244 0 <NetWorker-Server> savegrp NSR notice Action backup traditional 'Backup' with job id 33079478 is exiting with status 'failed', exit code 1
Sul client Windows, i registri eventi di sistema mostrano un evento BugCheck che si è verificato simultaneamente quando è pianificato un backup. Tale evento ha causato il riavvio del computer client.
Questo viene visualizzato solo durante i backup abilitati per il Servizio Copia Shadow del volume (VSS) (impostazione predefinita). Se il client Windows è configurato in NetWorker con operazioni di salvataggio VSS:*=off, il backup ha esito positivo.
Causa
Durante la creazione di istantanee VSS, è possibile impilare insieme i driver di filtro del file system in modalità kernel di più prodotti di sicurezza (ad esempio, antivirus (AV), HIPS, DLP, crittografia del disco, EDR). I filtri simultanei in tempo reale di due prodotti AV aumentano l'utilizzo dello stack del kernel durante percorsi I/O complessi. Ciò può esaurire lo stack e attivare un BugCheck.
Risoluzione
Elenco di controllo di diagnostica (raccogliere prima di scegliere un percorso di risoluzione)
- Acquisizione dei dettagli di BugCheck:
Il Visualizzatore eventi → sistema → ID evento 1001 (BugCheck). Prendere nota del codice di arresto e del driver guasto (ad esempio, xxx.sys), se disponibili.
Raccogliere minidumps (%SystemRoot%\Minidump).
- Integrità VSS:
vssadmin list writers (cerca Stabile senza errori)vssadmin list providers
Controllare nel Visualizzatore eventi → nell'applicazione per i registri operativi VSS (ID 8193, 12293), VolSnap (ad esempio, 25) e defender/mcafee al momento dell'incidente.
Per ulteriori informazioni, consultare: NetWorker: Risoluzione degli errori di backup dovuti a problemi VSS
- Inventario dello stack di driver filtrati:
fltmc (elenco dei driver e dell'ordine dei filtri del file system)
- Controllo della riproduzione: Verificare che il backup sia stato completato in modo coerente con
VSS:*=Off(stabilisce che l'arresto anomalo è specifico del percorso VSS).

DISASTER_RECOVERY:\ Il saveset non viene sottoposto a backup. Un backup senza VSS non sarebbe coerente con il BMR.
Risoluzione (a più livelli, preferenza per un'interruzione minima)
A. Rendere VSS e NetWorker "compatibili con AV" (prima opzione consigliata)
- Esclusioni della scansione in tempo reale (entrambi i prodotti AV):
- Lavorazioni:
nsrexecd.exe,save.exe,savefs.exe,nsrsvc.exe(se presente) e qualsiasi file binario dell'helper NetWorker inC:\Program Files\EMC NetWorker\nsr\bin\(o il percorso di installazione). - Cartelle:
C:\Program Files\EMC NetWorker\(interonsrtree), NetWorker temporanei e percorsi della cache se personalizzati. - Artefatti VSS:
Escludi l'accesso a\\?\GLOBALROOT\Device\HarddiskVolumeShadowCopy*e posizioni di staging VSS per evitare l'ispezione approfondita dei volumi di istantanee durante la creazione.
- Lavorazioni:
- Difensore: Preferire la modalità passiva quando un antivirus di terze parti gestisce la protezione in tempo reale (utilizzando la configurazione di policy o Defender). In questo modo si mantiene la visibilità EDR evitando al contempo il doppio conflitto di filtri in tempo reale.
- McAfee: Applicare le esclusioni consigliate da NetWorker/VSS; assicurarsi che le policy HIPS o DLP non esaminino le copie shadow o blocchino
volsnap/vssvc.
Risultato: Riduce l'attività del filtro durante le operazioni VSS e la pressione sullo stack del kernel senza rimuovere AV.
B. Ridurre la profondità di driver e filtro durante l'esperienza VSS.
- Disabilitare temporaneamente i moduli endpoint non essenziali (HIPS, DLP, controllo dei dispositivi) durante le finestre di backup in base alla policy, se il team di sicurezza approva.
- Aggiornare i driver o le definizioni AV e gli aggiornamenti cumulativi di Windows VSS/VolSnap : i driver obsoleti contribuiscono alle inefficienze di utilizzo dello stack.
- Se è presente un provider VSS di terze parti , forzare il provider Microsoft Software Shadow Copy (impatto del test):
- Controlli di servizio: Garantire
Volume Shadow CopyIl servizio è integro. - Disabilitare o districare i provider non Microsoft se sono noti conflitti (in coordinamento con la piattaforma o il team di sicurezza).
- Controlli di servizio: Garantire
C. Pianificazione e mitigazione del carico
- Eseguire i backup al di fuori dei picchi di attività (I/O, scansioni o attività degli endpoint a uso intensivo di I/O).
- Scaglionamento dei job in modo che un minor numero di client attivi contemporaneamente istantanee VSS se le policy centrali causano scansioni sincronizzate.
D. Ultima risorsa (da evitare, a meno che non sia obbligatorio)
- Scegli un prodotto AV in tempo reale . Se il criterio lo consente, impostare Defender in modalità passiva/solo EDR o disabilitare completamente la modalità in tempo reale quando McAfee è l'antivirus principale.
La disinstallazione di un antivirus dovrebbe essere un passaggio finale, non la raccomandazione predefinita.
E. Soluzione alternativa operativa (se prevalgono le esigenze aziendali)
- Continuare i backup con
VSS:*=Offtemporaneamente se il rischio di coerenza è accettabile per il carico di lavoro interessato. Documentare che la coerenza delle applicazioni a livello di VSS (writer) può essere ridotta (ad esempio, file aperti). Utilizzare per dataset non critici solo durante il processo di correzione.
Verifica
- Dopo aver applicato le esclusioni e le ottimizzazioni dei driver, eseguire:
vssadmin list writers→ confermareStable- Test di un'istantanea manuale:
wmic shadowcopy call create Volume='C:\'(monitoraggio degli eventi per il controllo dei bug) - Eseguire un backup del file system NetWorker su un singolo volume; Quindi eseguire lo scale-up.
- Verificare che non sia stato eseguito alcun BugCheck e che il processo venga completato con VSS abilitato.