NetWorker: Подія перевірки багів у клієнтській системі Windows викликає перезавантаження системи під час резервного копування
Riepilogo: Клієнтська машина Windows перезавантажується щоразу, коли ініціюється резервне копіювання файлової системи. Середовище Кастерів. Обидва вузли мають однакову проблему.
Sintomi
Резервне копіювання файлової системи NetWorker хоста Windows не вдається.
У журналах NetWorker немає очевидних помилок, що вказують на причину:
181407:save: Step (1 of 5) for PID-10948: Save has been started on the client '<client-name>'. 174412:save: Step (2 of 5) for PID-10948: Running the backup on the client '<client-name>' for the save set 'pseudo_saveset'. 174424:save: Step (3 of 5) for PID-10948: Creating the snapshot for the selected save sets. --- Job Indications --- <client-name>:pseudo_saveset: retried 1 times.
184008 08/16/2023 02:30:58 AM 1 5 0 999192384 50244 0 <NetWorker-Server> savegrp NSR notice Client '<client-name>' is being skipped because no savesets of this client have been backed up as part of the backup action. 148758 08/16/2023 02:31:03 AM 1 5 0 999192384 50244 0 <NetWorker-Server> savegrp NSR notice Action backup traditional 'Backup' with job id 33079478 is exiting with status 'failed', exit code 1
У клієнті Windows журнали подій System Event показують, що подія BugCheck відбулася одночасно з запланованим резервним копіюванням. Ця подія спричинила перезавантаження клієнтської машини.
Це з'являється лише під час резервних копій, увімкнених Volume Shadow Copy Service (VSS) (за замовчуванням). Якщо клієнт Windows налаштований у NetWorker з операціями збереження VSS:*=off, резервне копіювання вдається.
Causa
Під час створення VSS-знімків драйвери фільтрів файлової системи в режимі ядра з кількох продуктів безпеки можуть накопичуватися разом (наприклад, Antivirus (AV), HIPS, DLP, шифрування диска, EDR). Паралельні фільтри реального часу з двох антивірусних продуктів збільшують використання стека ядра під час складних шляхів введення/виведення. Це може вичерпати стек і спровокувати BugCheck.
Risoluzione
Діагностичний контрольний список (збирати перед вибором шляху вирішення)
- Деталі Захоплення BugCheck:
Переглядач подій → системи → Event ID 1001 (BugCheck). Запишіть код STOP і несправність водія (наприклад, xxx.sys), якщо доступний.
Збирати minidumps (%SystemRoot%\Minidump).
- Здоров'я VSS:
vssadmin list writers (шукайте Stable без помилки)vssadmin list providers
Перевірте журнали операцій Event Viewer → Application для VSS (ID 8193, 12293), VolSnap (наприклад, 25) та захисника/mcafee на момент інциденту.
Детальніше дивіться: NetWorker: Усунення несправностей із несправностями резервного копіювання через проблеми з VSS
- Інвентар стека драйверів фільтрів:
fltmc (перелік драйверів фільтра файлової системи та порядок)
- Репродукційне керування: Переконайтеся, що резервне копіювання завершується послідовно з
VSS:*=Off(встановлює, що збій є специфічним для шляху VSS).

DISASTER_RECOVERY:\ Save set не має резервної копії. Резервна копія без VSS не буде стабільною за BMR.
Роздільна здатність (Багаторівнева — віддаю перевагу мінімальним порушенням)
A. Зробити VSS і NetWorker «дружніми до AV» (рекомендую спочатку)
- Виключення сканування в реальному часі (обидва AV-продукти):
- Процеси:
nsrexecd.exe,save.exe,savefs.exe,nsrsvc.exe(якщо присутній), а також будь-які допоміжні бінарні файли NetWorker підC:\Program Files\EMC NetWorker\nsr\bin\(або ваш шлях встановлення). - Папки:
C:\Program Files\EMC NetWorker\(повнийnsrдерево), тимчасові шляхи NetWorker, а також кеш-шляхи, якщо налаштовано. - Артефакти VSS:
Виключити доступ до\\?\GLOBALROOT\Device\HarddiskVolumeShadowCopy*та VSS-розташування локацій для уникнення глибокої перевірки об'ємів знімків під час створення.
- Процеси:
- Захисник: Віддавайте перевагу пасивному режиму , коли сторонній антивірус керує захистом у реальному часі (використовуючи політику або конфігурацію Defender). Це зберігає видимість EDR, уникаючи конфлікту з подвійним фільтром у реальному часі.
- МакАфі: Застосуйте рекомендовані виключення NetWorker/VSS; Забезпечити, щоб політики HIPS або DLP не перевіряли тіньові копії або блокували
volsnap/vssvc.
Результат: Знижує активність фільтра під час роботи VSS і знижує тиск у трубі ядра без видалення антивірусу.
B. Зменшити глибину драйвера та фільтра під час VSS.
- Тимчасово вимкніть неважливі модулі кінцевих точок (HIPS, DLP, керування пристроями) під час резервних вікон за політикою, якщо ваша команда безпеки схвалює.
- Оновіть драйвери або визначення антивірусів та кумулятивні оновлення Windows VSS/VolSnap — застарілі драйвери сприяють неефективності використання стеку.
- Якщо присутній сторонній VSS-провайдер , примусово використайте Microsoft Software Shadow Copy (тестовий вплив):
- Сервісні перевірки: Забезпечте
Volume Shadow CopyСервіс — це здорово. - Вимкніть або розплутуйте не-Microsoft провайдерів, якщо відомо, що вони конфліктують (у координації з платформою або командою безпеки).
- Сервісні перевірки: Забезпечте
C. Планування та зниження навантаження
- Запускайте резервні копії поза піковою активністю (інтенсивні I/O, сканування або завдання кінцевих пристроїв).
- Stagger завдання, щоб менше клієнтів одночасно запускали VSS-знімок, якщо центральні політики спричиняють синхронізовані сканування.
D. Останній засіб (уникати, якщо це не обов'язково)
- Обирайте один AV-продукт у реальному часі . Якщо політика дозволяє, встановіть Defender у пасивний/лише EDR-режим або повністю вимкніть режим у реальному часі, коли McAfee є основним антивірусом.
Видалення антивірусу має бути фінальним кроком, а не стандартною рекомендацією.
E. Операційний обхідний шлях (якщо бізнесу потрібна перешкода)
- Продовжуйте резервні копії з
VSS:*=Offтимчасово , якщо ризик стабільності прийнятний для навантаження, що постраждало. Задокументуйте, що узгодженість застосунків на рівні VSS (автори) може бути зменшена (наприклад, відкриті файли). Використовуйте некритичні набори даних лише під час продовження коригації.
Верифікація
- Після застосування виключень і оптимізації драйверів запускайте:
vssadmin list writers→ підтвердитиStable- Перевірте ручний знімок:
wmic shadowcopy call create Volume='C:\'(моніторити події для перевірки багів) - Запустіть резервну копію файлової системи NetWorker на одному томі; Потім масштабуйте.
- Переконайтеся , що BugCheck немає , і завдання завершується з увімкненим VSS.