NetWorker. Событие проверки системных ошибок клиента Windows приводит к перезагрузке системы во время резервного копирования
Riepilogo: Клиентский компьютер Windows перезагружается при каждом запуске резервного копирования файловой системы. Среда Custer. На обоих узлах одна и та же проблема.
Sintomi
Резервное копирование хоста Windows в файловой системе NetWorker завершается сбоем.
В журналах NetWorker нет очевидных ошибок, указывающих на причину:
181407:save: Step (1 of 5) for PID-10948: Save has been started on the client '<client-name>'. 174412:save: Step (2 of 5) for PID-10948: Running the backup on the client '<client-name>' for the save set 'pseudo_saveset'. 174424:save: Step (3 of 5) for PID-10948: Creating the snapshot for the selected save sets. --- Job Indications --- <client-name>:pseudo_saveset: retried 1 times.
184008 08/16/2023 02:30:58 AM 1 5 0 999192384 50244 0 <NetWorker-Server> savegrp NSR notice Client '<client-name>' is being skipped because no savesets of this client have been backed up as part of the backup action. 148758 08/16/2023 02:31:03 AM 1 5 0 999192384 50244 0 <NetWorker-Server> savegrp NSR notice Action backup traditional 'Backup' with job id 33079478 is exiting with status 'failed', exit code 1
В клиенте Windows в журналах системных событий отображается событие BugCheck, которое произошло одновременно с расписанием резервного копирования. Это событие привело к перезагрузке клиентского компьютера.
Эта функция отображается только во время резервного копирования с включенной службой теневого копирования томов (VSS) (по умолчанию). Если клиент Windows настроен в NetWorker с операциями сохранения VSS:*=off, резервное копирование будет выполнено успешно.
Causa
Во время создания моментального снимка VSS драйверы фильтра файловой системы режима ядра из нескольких продуктов для обеспечения безопасности могут объединяться в стеки (например, Antivirus (AV), HIPS, DLP, disk encryption, EDR). Одновременные фильтры реального времени от двух продуктов антивирусной защиты увеличивают загрузку стека ядра при сложных путях ввода-вывода. Это может привести к исчерпанию стека и запуску проверки ошибок.
Risoluzione
Диагностический контрольный список (сбор данных перед выбором пути решения)
- Детали Capture BugCheck:
Event Viewer → System → Event ID 1001 (BugCheck). Запишите код STOP и неисправный драйвер (например, xxx.sys), если он доступен.
Собирать minidumps (%SystemRoot%\Minidump).
- Состояние VSS:
vssadmin list writers (ищите «Стабильно» без ошибок)vssadmin list providers
Проверьте приложение Event Viewer → наличие журналов операций VSS (идентификаторы 8193, 12293), VolSnap (например, 25) и операционные журналы Defender/McAfee на момент инцидента.
Дополнительные сведения см. в разделе: NetWorker. Поиск и устранение сбоев резервного копирования из-за проблем VSS
- Фильтрация инвентаризации стека драйверов:
fltmc (выводит список драйверов фильтров файловой системы и порядок)
- Управление воспроизведением: Убедитесь, что резервное копирование выполняется согласованно с помощью
VSS:*=Off(устанавливает, что сбой связан с VSS-путем).

DISASTER_RECOVERY:\ Резервное копирование не выполнено. Резервное копирование без VSS не будет соответствовать BMR.
Решение (многоуровневое — предпочтительно минимальное прерывание работы)
А. Сделать VSS и NetWorker "дружественными к антивирусу" (рекомендуется в первую очередь)
- Исключения сканирования в режиме реального времени (оба антивирусных продукта):
- Процессы:
nsrexecd.exe,save.exe,savefs.exe,nsrsvc.exe(при наличии), а также любые двоичные файлы вспомогательной службы NetWorker вC:\Program Files\EMC NetWorker\nsr\bin\(или ваш путь установки). - Папки:
C:\Program Files\EMC NetWorker\(целикомnsrдерева), NetWorker временно и пути кэша, если они настроены. - Артефакты VSS:
Исключить доступ к\\?\GLOBALROOT\Device\HarddiskVolumeShadowCopy*и промежуточных расположений VSS, чтобы избежать глубокой проверки томов моментальных снимков во время их создания.
- Процессы:
- Защитник: Предпочитайте пассивный режим, когда стороннее антивирусное управление управляет защитой в режиме реального времени (с помощью политики или конфигурации Defender). Это обеспечивает видимость EDR, избегая двойной конкуренции фильтров в режиме реального времени.
- McAfee: Применение исключений, рекомендованных NetWorker/VSS; Убедитесь, что политики HIPS или DLP не проверяют теневые копии и не блокируют их.
volsnap/vssvc.
Результат. Снижает активность фильтра во время операций VSS и снижает давление в стек ядра без удаления антивирусной защиты.
B. Уменьшите глубину драйвера и фильтра во время VSS.
- Временно отключите второстепенные модули конечных точек (HIPS, DLP, управление устройствами) во время сеансов резервного копирования в соответствии с политикой, если это одобрено вашей службой безопасности.
- Обновление драйверов или определений антивирусной защиты, а также накопительных обновлений Windows VSS/VolSnap — устаревшие драйверы приводят к неэффективному использованию стека.
- Если присутствует сторонний поставщик VSS , принудительно используйте поставщика теневого копирования программного обеспечения Microsoft (влияние на тест):
- Сервисные проверки: Обеспечить
Volume Shadow CopyСервис работоспособен. - Отключить или распутать сторонние поставщики, если известно, что они конфликтуют друг с другом (по согласованию с платформой или командой безопасности).
- Сервисные проверки: Обеспечить
В. Планирование и снижение нагрузки
- Выполняйте резервное копирование вне пиковой нагрузки (интенсивные операции ввода-вывода, сканирования или задачи конечных точек).
- Организуйте задания в шахматном порядке, чтобы меньшее количество клиентов одновременно активировало моментальный снимок VSS, если центральные политики вызывают синхронизированное сканирование.
D. Крайняя мера (избегайте, если это не обязательно)
- Выберите один аудиовизуальный продукт, работающий в режиме реального времени . Если политика позволяет, переведите Defender в пассивный режим / режим только EDR или полностью отключите режим реального времени, если McAfee является основным антивирусом.
Удаление антивирусной защиты должно быть последним шагом, а не рекомендацией по умолчанию.
Д. Оперативное временное решение (если бизнес-потребности в переопределении)
- Продолжить резервное копирование с помощью
VSS:*=OffВременно , если риск согласованности является приемлемым для затронутой рабочей нагрузки. Документально подтвердить, что согласованность приложений уровня VSS (модулей записи) может быть снижена (например, открытые файлы). Используйте только для некритических наборов данных, пока выполняется исправление.
Проверка
- После применения исключений и оптимизации драйверов выполните команду:
vssadmin list writers→ подтвердитьStable- Тестирование моментального снимка вручную:
wmic shadowcopy call create Volume='C:\'(мониторинг событий для проверки ошибок) - Запустите резервное копирование файловой системы NetWorker на одном томе; Затем выполните масштабирование.
- Убедитесь, что Проверка ошибок отсутствует , и задание будет завершено с включенным VSS.