NetWorker: Windows 클라이언트 System BugCheck 이벤트로 인해 백업 중 시스템이 재부팅됨
Riepilogo: 파일 시스템 백업이 시작될 때마다 Windows 클라이언트 시스템이 재부팅됩니다. 커스터 환경. 두 노드 모두 동일한 문제가 있습니다.
Sintomi
Windows 호스트의 NetWorker 파일 시스템 백업이 실패합니다.
NetWorker 로그에 원인을 나타내는 뚜렷한 오류가 없습니다.
181407:save: Step (1 of 5) for PID-10948: Save has been started on the client '<client-name>'. 174412:save: Step (2 of 5) for PID-10948: Running the backup on the client '<client-name>' for the save set 'pseudo_saveset'. 174424:save: Step (3 of 5) for PID-10948: Creating the snapshot for the selected save sets. --- Job Indications --- <client-name>:pseudo_saveset: retried 1 times.
184008 08/16/2023 02:30:58 AM 1 5 0 999192384 50244 0 <NetWorker-Server> savegrp NSR notice Client '<client-name>' is being skipped because no savesets of this client have been backed up as part of the backup action. 148758 08/16/2023 02:31:03 AM 1 5 0 999192384 50244 0 <NetWorker-Server> savegrp NSR notice Action backup traditional 'Backup' with job id 33079478 is exiting with status 'failed', exit code 1
Windows 클라이언트의 시스템 이벤트 로그는 백업이 예약될 때 동시에 발생한 BugCheck 이벤트를 보여 줍니다. 이 이벤트로 인해 클라이언트 컴퓨터가 재부팅되었습니다.
VSS(볼륨 섀도 복사본 서비스)가 활성화된 백업 중에만 나타납니다(기본값). Windows 클라이언트가 NetWorker에서 세이브 작업으로 구성된 경우 VSS:*=off, 백업이 성공합니다.
Causa
VSS 스냅숏을 만드는 동안 여러 보안 제품의 커널 모드 파일 시스템 필터 드라이버가 함께 쌓일 수 있습니다(예: 바이러스 백신(AV), HIPS, DLP, 디스크 암호화, EDR). 두 AV 제품의 동시 실시간 필터는 복잡한 I/O 경로에서 커널 스택 사용량을 증가시킵니다. 이렇게 하면 스택이 소진되고 BugCheck가 트리거될 수 있습니다.
Risoluzione
진단 체크리스트(해결 경로를 선택하기 전에 수집)
- BugCheck 세부 정보 캡처:
이벤트 뷰어 → 시스템 → 이벤트 ID 1001(BugCheck)입니다. STOP 코드 및 드라이버에 장애가 발생한 경우(예: xxx.sys)을 기록합니다.
수집 minidumps (%SystemRoot%\Minidump)를 제공해야 합니다.
- VSS 상태:
vssadmin list writers (오류가 없는 안정 찾기)vssadmin list providers
인시던트 → VSS(ID 8193, 12293), VolSnap(예: 25) 및 Defender/McAfee 운영 로그에 대한 이벤트 뷰어 애플리케이션을 확인합니다.
자세한 내용은 다음을 참조하십시오. NetWorker: VSS 문제로 인한 백업 실패 문제 해결
- 필터 드라이버 스택 인벤토리:
fltmc (파일 시스템 필터 드라이버 나열 및 순서)
- 재현 제어: 다음 상태에서 백업이 일관되게 완료되는지 확인합니다.
VSS:*=Off(충돌이 VSS 경로에 따라 다르다는 것을 설정).

DISASTER_RECOVERY:\ 세이브 세트가 백업되지 않습니다. VSS가 없는 백업은 BMR 일관성이 없습니다.
해결 방법(계층형 - 중단을 최소화하는 방법 선호)
A. VSS 및 NetWorker를 "AV 친화적"으로 설정(먼저 권장)
- 실시간 스캐닝 제외 (두 AV 제품 모두):
- 프로세스:
nsrexecd.exe,save.exe,savefs.exe,nsrsvc.exe(있는 경우) 및C:\Program Files\EMC NetWorker\nsr\bin\(또는 설치 경로)를 클릭합니다. - 폴더:
C:\Program Files\EMC NetWorker\(전체nsr트리), NetWorker 임시 및 캐시 경로(사용자 정의된 경우)가 있습니다. - VSS 아티팩트:
다음에 대한 액세스 제외\\?\GLOBALROOT\Device\HarddiskVolumeShadowCopy*및 VSS 스테이징 위치를 추가하여 스냅샷 생성 중에 스냅샷 볼륨을 심층 검사하지 않도록 합니다.
- 프로세스:
- 수비수: 타사 AV가 실시간 보호를 관리하는 경우(정책 또는 Defender 구성 사용) 수동 모드를 선호합니다. 이를 통해 이중 실시간 필터 경합을 방지하면서 EDR 가시성을 유지할 수 있습니다.
- McAfee: NetWorker/VSS 권장 제외 사항을 적용합니다. HIPS 또는 DLP 정책이 섀도우 복제본을 검사하거나 차단하지 않도록 합니다.
volsnap/vssvc.
결과: AV를 제거하지 않고 VSS 작업 중 필터 활동을 줄이고 커널 스택 압력을 낮춥니다.
B. VSS 중에 드라이버 및 필터 깊이를 줄입니다.
- 보안 팀이 승인하는 경우 정책에 따라 백업 기간 동안필수적이지 않은 엔드포인트 모듈(HIPS, DLP, 디바이스 제어)을 일시적으로 비활성화합니다.
- AV 드라이버 또는 정의 업데이트 및 Windows VSS/VolSnap 누적 업데이트 - 오래된 드라이버는 스택 사용 비효율성을 초래합니다.
- 타사 VSS Provider가 있는 경우 Microsoft Software Shadow Copy Provider를 강제 적용합니다(테스트 영향).
- 서비스 확인: 확인
Volume Shadow Copy서비스가 정상입니다. - Microsoft 이외의 공급자가 충돌하는 것으로 알려진 경우 사용하지 않도록 설정하거나 연결을 해제합니다(플랫폼 또는 보안 팀과 조율하여).
- 서비스 확인: 확인
C. 스케줄링 및 부하 완화
- 작업량이 많은 백업 작업 이외의 백업(과중한 I/O, 스캔 또는 엔드포인트 작업)을 실행합니다.
- 중앙 정책으로 인해 동기화된 스캔이 발생하는 경우 더 적은 수의 클라이언트가 동시에 VSS 스냅샷을 트리거하도록 작업에 시차를 둡니다.
D. 최후의 수단(필수가 아니면 피함)
- 하나의 실시간 AV 제품을 선택하십시오 . 정책에서 허용하는 경우 Defender를 패시브/EDR 전용 모드로 설정하거나 McAfee가 주 AV인 경우 실시간을 완전히 비활성화합니다.
AV 제거는 기본 권장 사항이 아니라 최종 단계여야 합니다.
E. 운영 해결 방법(비즈니스 요구 사항이 재정의되는 경우)
- 다음으로 백업 계속
VSS:*=Off영향을 받는 워크로드에 대해 일관성 위험이 허용되는 경우 일시적입니다. VSS 수준 애플리케이션 정합성(writer)이 감소할 수 있음을 문서화합니다(예: 열린 파일). 문제 해결이 진행되는 동안 중요하지 않은 데이터 세트에만 사용합니다.
확인
- 제외 및 드라이버 최적화를 적용한 후 다음을 실행합니다.
vssadmin list writers→ 확인Stable- 수동 스냅샷 테스트:
wmic shadowcopy call create Volume='C:\'(버그 검사에 대한 이벤트 모니터링) - 단일 볼륨에서 NetWorker 파일 시스템 백업 실행 그런 다음 스케일 업하십시오.
- BugCheck가 없는지 확인하면 VSS가 활성화된 상태로 작업이 완료됩니다.