NetWorker: Zdarzenie FaultCheck systemu klienta Windows powoduje ponowne uruchomienie systemu podczas tworzenia kopii zapasowej
Podsumowanie: Komputer kliencki z systemem Windows jest uruchamiany ponownie za każdym razem, gdy inicjowana jest kopia zapasowa systemu plików. Środowisko Custera. Oba węzły mają ten sam problem.
Objawy
Tworzenie kopii zapasowej systemu plików NetWorker hosta z systemem Windows kończy się niepowodzeniem.
W dziennikach NetWorker nie ma oczywistych błędów wskazujących na przyczynę:
181407:save: Step (1 of 5) for PID-10948: Save has been started on the client '<client-name>'. 174412:save: Step (2 of 5) for PID-10948: Running the backup on the client '<client-name>' for the save set 'pseudo_saveset'. 174424:save: Step (3 of 5) for PID-10948: Creating the snapshot for the selected save sets. --- Job Indications --- <client-name>:pseudo_saveset: retried 1 times.
184008 08/16/2023 02:30:58 AM 1 5 0 999192384 50244 0 <NetWorker-Server> savegrp NSR notice Client '<client-name>' is being skipped because no savesets of this client have been backed up as part of the backup action. 148758 08/16/2023 02:31:03 AM 1 5 0 999192384 50244 0 <NetWorker-Server> savegrp NSR notice Action backup traditional 'Backup' with job id 33079478 is exiting with status 'failed', exit code 1
Na kliencie Windows dzienniki zdarzeń systemowych pokazują, że zdarzenie BugCheck wystąpiło jednocześnie podczas planowania kopii zapasowej. To zdarzenie spowodowało ponowne uruchomienie komputera klienckiego.
Ten komunikat pojawia się tylko podczas tworzenia kopii zapasowych z włączoną usługą kopiowania woluminów w tle (VSS) (ustawienie domyślne). Jeśli klient Windows jest skonfigurowany w NetWorker z operacjami składowania VSS:*=off, tworzenie kopii zapasowej zakończy się pomyślnie.
Przyczyna
Podczas tworzenia migawki usługi VSS sterowniki filtrów systemu plików trybu jądra z wielu produktów zabezpieczających mogą łączyć się w stos (na przykład program antywirusowy (AV), HIPS, DLP, szyfrowanie dysków, EDR). Równoczesne filtry w czasie rzeczywistym z dwóch produktów antywirusowych zwiększają wykorzystanie stosu jądra podczas złożonych ścieżek we/wy. Może to spowodować wyczerpanie stosu i wywołanie BugCheck.
Rozwiązanie
Diagnostyczna lista kontrolna (zbieranie przed wyborem ścieżki rozwiązania)
- Przechwyć szczegóły BugCheck:
Podgląd zdarzeń → System → identyfikator zdarzenia 1001 (BugCheck). Zapisz kod STOP i awarię sterownika (na przykład xxx.sys), jeśli jest dostępny.
Zbierać minidumps (%SystemRoot%\Minidump).
- Kondycja usługi VSS:
vssadmin list writers (poszukaj stabilnej bez błędu)
vssadmin list providers
Sprawdź dzienniki operacyjne Podgląd zdarzeń → aplikacji VSS (identyfikatory 8193, 12293), VolSnap (na przykład 25) i defender/McAfee w czasie zdarzenia.
Aby uzyskać więcej informacji, zobacz: NetWorker: Rozwiązywanie problemów z kopiami zapasowymi z powodu problemów z usługą VSS
- Filtruj zasoby stosu sterowników:
fltmc (lista sterowników filtra systemu plików i kolejność)
- Kontrola odtworzenia: Upewnij się, że tworzenie kopii zapasowej zostało wykonane zgodnie z
VSS:*=Off(określa, że awaria jest specyficzna dla ścieżki VSS).

DISASTER_RECOVERY:\ Nie utworzono kopii zapasowej zestawu zapisanego. Kopia zapasowa bez usługi VSS nie byłaby spójna z BMR.
Rozwiązanie (warstwowe — preferuj minimalne zakłócenia)
A. Ustaw VSS i NetWorker jako przyjazne dla AV (zalecane najpierw)
- Wykluczenia ze skanowania w czasie rzeczywistym (oba produkty antywirusowe):
- Procesy:
nsrexecd.exe,save.exe,savefs.exe,nsrsvc.exe(jeśli są obecne) i wszystkie pliki binarne pomocnika NetWorker w obszarze
C:\Program Files\EMC NetWorker\nsr\bin\(lub ścieżkę instalacji). - Foldery:
C:\Program Files\EMC NetWorker\(całośćnsrtree), NetWorker tymczasowy i ścieżki pamięci podręcznej, jeśli są dostosowane. - Artefakty usługi VSS:
Wykluczanie dostępu do\\?\GLOBALROOT\Device\HarddiskVolumeShadowCopy*i lokalizacje przemieszczania VSS, aby uniknąć głębokiej inspekcji woluminów migawek podczas tworzenia.
- Procesy:
- Obrońca: Preferuj tryb pasywny , gdy AV innej firmy zarządza ochroną w czasie rzeczywistym (przy użyciu konfiguracji zasad lub usługi Defender). Pozwala to zachować widoczność EDR przy jednoczesnym uniknięciu podwójnej rywalizacji o filtry w czasie rzeczywistym.
- McAfee: Stosowanie wykluczeń zalecanych przez NetWorker/VSS; dopilnowanie, aby zasady systemu HIPS lub DLP nie sprawdzały kopii w tle ani bloków
volsnap/vssvc.
Wynik: Zmniejsza aktywność filtra podczas operacji VSS i obniża ciśnienie w stosie jądra bez usuwania AV.
B. Zmniejsz głębokość sterownika i filtra podczas VSS.
- Tymczasowo wyłącz niepotrzebne moduły punktów końcowych (HIPS, DLP, kontrola urządzeń) podczas tworzenia okien tworzenia kopii zapasowych zgodnie z zasadami, jeśli zespół ds. zabezpieczeń wyrazi na to zgodę.
- Zaktualizuj sterowniki lub definicje AV oraz aktualizacje zbiorcze Windows VSS/VolSnap — nieaktualne sterowniki przyczyniają się do nieefektywności wykorzystania stosu.
- Jeśli dostawca usługi VSS innej firmy jest obecny, wymuś dostawcę kopiowania oprogramowania w tle firmy Microsoft (wpływ testu):
- Kontrole serwisowe: Zapewnienia
Volume Shadow CopyUsługa działa prawidłowo. - Wyłącz lub rozwiąż dostawców innych niż Microsoft, jeśli wiadomo, że są w konflikcie (w koordynacji z platformą lub zespołem ds. zabezpieczeń).
- Kontrole serwisowe: Zapewnienia
C. Planowanie i ograniczanie obciążenia
- Uruchamianie kopii zapasowych poza szczytową aktywnością (duże operacje we/wy, skanowania lub zadania punktu końcowego).
- Rozkładaj zadania tak, aby mniejsza liczba klientów wyzwalała migawkę VSS jednocześnie, jeśli zsynchronizowane są skanowania synchroniczne przez zasady centralne.
D. Ostatnia deska ratunku (unikać, chyba że jest to obowiązkowe)
- Wybierz jeden produkt antywirusowy czasu rzeczywistego . Jeśli zasady na to pozwalają, ustaw Defender na tryb pasywny/tylko EDR lub całkowicie wyłącz czas rzeczywisty, gdy McAfee jest głównym AV.
Odinstalowanie AV powinno być ostatnim krokiem, a nie domyślnym zaleceniem.
E. Obejście problemu operacyjnego (jeśli firma wymaga zastąpienia)
- Kontynuuj tworzenie kopii zapasowych za pomocą
VSS:*=Offtymczasowo , jeśli ryzyko spójności jest dopuszczalne dla obciążenia roboczego, którego dotyczy problem. Udokumentuj, że spójność aplikacji na poziomie usługi VSS (składniki zapisywania) może być zmniejszona (na przykład otwarte pliki). Używaj w przypadku niekrytycznych zestawów danych tylko podczas postępu korygowania.
Weryfikacja
- Po zastosowaniu wykluczeń i optymalizacji sterowników uruchom:
vssadmin list writers→ potwierdzićStable- Przetestuj migawkę ręcznie:
wmic shadowcopy call create Volume='C:\'(monitoruj zdarzenia pod kątem sprawdzania błędów) - Uruchamianie kopii zapasowej systemu plików NetWorker na pojedynczym woluminie; Następnie skaluj w górę.
- Potwierdź, że nie ma funkcji BugCheck , a zadanie zostanie ukończone z włączoną usługą VSS.