NetWorker: El evento de comprobación de errores del sistema cliente Windows provoca el reinicio del sistema durante el respaldo
Riepilogo: El equipo cliente de Windows se reinicia cada vez que se inicia el respaldo del sistema de archivos. Entorno de Custer. Ambos nodos tienen el mismo problema.
Sintomi
Se produce un error en un respaldo del sistema de archivos de NetWorker de un host Windows.
No hay errores evidentes que indiquen la causa en los registros de NetWorker:
181407:save: Step (1 of 5) for PID-10948: Save has been started on the client '<client-name>'. 174412:save: Step (2 of 5) for PID-10948: Running the backup on the client '<client-name>' for the save set 'pseudo_saveset'. 174424:save: Step (3 of 5) for PID-10948: Creating the snapshot for the selected save sets. --- Job Indications --- <client-name>:pseudo_saveset: retried 1 times.
184008 08/16/2023 02:30:58 AM 1 5 0 999192384 50244 0 <NetWorker-Server> savegrp NSR notice Client '<client-name>' is being skipped because no savesets of this client have been backed up as part of the backup action. 148758 08/16/2023 02:31:03 AM 1 5 0 999192384 50244 0 <NetWorker-Server> savegrp NSR notice Action backup traditional 'Backup' with job id 33079478 is exiting with status 'failed', exit code 1
En el cliente de Windows, los registros de eventos del sistema muestran que se produjo un evento BugCheck simultáneamente cuando se programa un respaldo. Ese evento hizo que el equipo cliente se reiniciara.
Esto solo aparece durante los respaldos habilitados para el Servicio de instantáneas de volumen (VSS) (valor predeterminado). Si el cliente de Windows está configurado en NetWorker con operaciones de guardado VSS:*=off, el respaldo se realiza correctamente.
Causa
Durante la creación de instantáneas de VSS, los controladores de filtro del sistema de archivos en modo kernel de varios productos de seguridad se pueden apilar (por ejemplo, antivirus (AV), HIPS, DLP, cifrado de disco, EDR). Los filtros simultáneos en tiempo real de dos productos antivirus aumentan el uso de la pila de kernel durante rutas de I/O complejas. Esto puede agotar la pila y desencadenar una comprobación de errores.
Risoluzione
Lista de comprobación de diagnóstico (recolecte antes de elegir una ruta de resolución)
- Capturar detalles de BugCheck:
Visor de eventos → sistema → ID de evento 1001 (BugCheck). Registre el código STOP y la falla del controlador (por ejemplo, xxx.sys), si está disponible.
Recolectar minidumps (%SystemRoot%\Minidump).
- Estado de VSS:
vssadmin list writers (busque Estable sin errores)vssadmin list providers
Compruebe el visor de eventos → la aplicación VSS (ID 8193, 12293), VolSnap (por ejemplo, 25) y los registros operativos de Defender/McAfee en el momento del incidente.
Para obtener más detalles, consulte: NetWorker: Solución de problemas de fallas de respaldo debido a problemas de VSS
- Filtrar inventario de pila de controladores:
fltmc (enumere el sistema de archivos, filtre los controladores y el orden)
- Control de reproducción: Confirme que el respaldo se complete de manera coherente con
VSS:*=Off(establece que el bloqueo es específico de la ruta de VSS).

DISASTER_RECOVERY:\ El saveset no está respaldado. Un respaldo sin VSS no sería coherente con BMR.
Resolución (en niveles: prefiera una interrupción mínima)
A. Haga que VSS y NetWorker sean "compatibles con AV" (se recomienda primero)
- Exclusiones de análisis en tiempo real (ambos productos AV):
- Procesos:
nsrexecd.exe,save.exe,savefs.exe,nsrsvc.exe(si está presente) y cualquier binario auxiliar de NetWorker enC:\Program Files\EMC NetWorker\nsr\bin\(o la ruta de instalación). - Carpetas:
C:\Program Files\EMC NetWorker\(enteronsrárbol), NetWorker temporal y rutas de caché si están personalizadas. - Artefactos de VSS:
Excluir el acceso a\\?\GLOBALROOT\Device\HarddiskVolumeShadowCopy*y ubicaciones de almacenamiento provisional de VSS para evitar la inspección profunda de los volúmenes de instantáneas durante la creación.
- Procesos:
- Defensor: Prefiera el modo Passive cuando un antivirus de terceros administra la protección en tiempo real (mediante la política o la configuración de Defender). Esto mantiene la visibilidad de EDR y, al mismo tiempo, evita la contención de filtros dobles en tiempo real.
- McAfee: Aplicar las exclusiones recomendadas de NetWorker/VSS; Asegúrese de que las políticas de HIPS o DLP no inspeccionen las instantáneas ni bloqueen
volsnap/vssvc.
Resultado: Reduce la actividad de filtrado durante las operaciones de VSS y disminuye la presión de la pila de kernel sin eliminar el AV.
B. Reduzca la profundidad del controlador y del filtro durante VSS.
- Deshabilite temporalmente módulos de terminales no esenciales (HIPS, DLP, control de dispositivos) durante las ventanas de respaldo por política si su equipo de seguridad lo aprueba.
- Actualice los controladores o las definiciones de AV y las actualizaciones acumulativas de Windows VSS/VolSnap : los controladores obsoletos contribuyen a las ineficiencias en el uso de la pila.
- Si hay un proveedor de VSS de otros fabricantes , fuerce el proveedor de instantáneas de software de Microsoft (impacto de la prueba):
- Comprobaciones de servicio: Asegurarse de que
Volume Shadow CopyEl servicio está en buen estado. - Deshabilite o desenrede proveedores que no son de Microsoft si se sabe que entran en conflicto (en coordinación con la plataforma o el equipo de seguridad).
- Comprobaciones de servicio: Asegurarse de que
C. Programación y reducción de la carga
- Ejecute respaldos fuera de la actividad máxima (actividad intensiva de I/O, escaneos o tareas de terminales).
- Escalone los trabajos para que menos clientes activen instantáneas de VSS simultáneamente si las políticas centrales provocan análisis sincronizados.
D. Último recurso (evitar a menos que sea obligatorio)
- Elija un producto antivirus en tiempo real . Si la política lo permite, configure Defender en modo pasivo/solo EDR o deshabilite completamente el modo en tiempo real cuando McAfee sea el antivirus principal.
La desinstalación de un antivirus debe ser un paso final, no la recomendación predeterminada.
E. Solución alternativa operativa (si el negocio necesita reemplazarse)
- Continúe con los respaldos con
VSS:*=OffTemporalmente si el riesgo de coherencia es aceptable para la carga de trabajo afectada. Documente que la coherencia de las aplicaciones en el nivel de VSS (escritores) se puede reducir (por ejemplo, archivos abiertos). Se utiliza para conjuntos de datos no críticos solo mientras se lleva a cabo la corrección.
Verificación
- Después de aplicar las exclusiones y las optimizaciones de controladores, ejecute lo siguiente:
vssadmin list writers→ confirmarStable- Pruebe una instantánea manual:
wmic shadowcopy call create Volume='C:\'(monitorear eventos para comprobaciones de errores) - Ejecute un respaldo del sistema de archivos de NetWorker en un solo volumen; Luego, escale verticalmente.
- Confirme que no haya comprobación de errores y que el trabajo se complete con VSS habilitado.