Podręcznik rozwiązywania problemów z NetWorker: Awarie procesów i zrzuty rdzenia
Podsumowanie: Kompleksowy przewodnik Dell NetWorker dotyczący rozwiązywania problemów z awariami procesów i zrzutami rdzenia
Objawy
Podręcznik rozwiązywania problemów z NetWorker: Awarie procesów i zrzuty rdzenia
Film: Kompleksowy przewodnik Dell NetWorker dotyczący rozwiązywania problemów z awariami procesów i zrzutami rdzenia
Obejrzyj w serwisie YouTube
Przyczyna
Rozwiązanie
UWAGA: Przed przystąpieniem do rozwiązywania problemów i diagnozowania zrzutu pamięci rdzenia w systemie należy znaleźć w witrynie pomocy technicznej firmy Dell artykuły dotyczące procesu, który powodował zrzut rdzenia. W niektórych scenariuszach opublikowano znaną poprawkę. Jeśli nie zostaną zidentyfikowane żadne poprawki, wykonaj czynności opisane w tym artykule. Każdy krok zawiera instrukcje lub łącze do dokumentu w celu wyeliminowania możliwych przyczyn i podjęcia niezbędnych działań naprawczych. Czynności są uporządkowane w najbardziej odpowiedniej kolejności w celu odizolowania problemu i zidentyfikowania właściwego rozwiązania. Nie pomijaj żadnego kroku.
Krok 1: Zbieranie informacji — opis problemu:
- W jakich okolicznościach proces ulega awarii. Czy to zachowanie jest spójne?
- Czy wcześniej działało to lepiej?
- Czasy wystąpień i obserwowany trend zachowań?
- Czy problem występuje tylko w okresach dużego obciążenia środowiska kopii zapasowych, kopii zapasowych lub określonego typu grupy kopii zapasowych?
- Kiedy problem wystąpił po raz pierwszy? Co się wtedy zmieniło?
- Jaki jest zakres problemu (wszyscy klienci/niektórzy klienci, wszystkie obiekty docelowe kopii zapasowych lub niektóre)?
- Co do tej pory próbowano naprawić i jakie wnioski z tego wyciągnięto.
Krok 2: Gromadzenie informacji - Środowisko
Który proces NetWorker nie odpowiada i na jakim komputerze (serwerze, węźle pamięci masowej lub kliencie).
- Wersja serwera NetWorker i platforma: NetWorker: Metody identyfikacji wersji oprogramowania NetWorker
- Omówienie rozmiaru i charakteru strefy danych kopii zapasowej
- Nośnik docelowy dla tych kopii zapasowych
Krok 3: Supportability
- Korzystając z internetowego przewodnika zgodności NetWorker (wymaga zalogowania się na konto pomocy technicznej firmy Dell), sprawdź, czy wszystkie elementy (serwer NetWorker, wersja systemu plików, proxy, węzły pamięci masowej, klienci, miejsce docelowe) są obsługiwane.
- Sprawdź, czy nie ma podstawowego systemu operacyjnego lub awarii sprzętu, które mogłyby spowodować awarie procesu (awarie dysków, zapełnienie dysku, błędy sieci itp.).
Krok 4: Najlepsze praktyki
Podręcznik planowania optymalizacji wydajności NetWorker zawiera listę wymagań programowych i sprzętowych, które umożliwiają obsługę optymalnie dostrojonego środowiska NetWorker. Należy to zweryfikować, aby upewnić się, że przestrzegane są najlepsze praktyki. Ma to zastosowanie, jeśli proces nie reaguje w okresach największego obciążenia. Dokumentacja NetWorker jest dostępna za pośrednictwem: Wsparcie dla NetWorker | Sterowniki i pliki do pobrania
Krok 5: Izolacja komponentów:
Sposób, w jaki znajdziemy pierwotną przyczynę braku odpowiedzi procesu, zależy od zachowania zdefiniowanego w kroku 1. Jeśli wyzwalacz jest nieznany, można przeprowadzić testy, aby spróbować ustalić, co powoduje awarię:
- Monitorowanie wydajności systemu przy dużym obciążeniu
- Sprawdź pliki dziennika systemu operacyjnego w czasie awarii pod kątem wspólnego zachowania.
- Linux:
/var/log/messages - Windows: Dzienniki zdarzeń systemu i aplikacji
- Linux:
- Przejrzyj dzienniki NetWorker, aby zobaczyć, jakie operacje są wykonywane, gdy występują zrzuty rdzenia i kiedy:
- Linux:
/nsr/logs/daemon.raw - Windows (domyślnie):
C:\Program Files\EMC NetWorker\nsr\logs\daemon.raw - NetWorker: Jak używać nsr_render_log do renderowania plików dziennika .raw
- Procesy specyficzne dla hosta NetWorker są zdefiniowane w: Procesy i porty NetWorker
- Linux:
- Dowiedz się, jakie operacje inne niż NetWorker są uruchamiane na tym komputerze, które mogą wpłynąć na jego zachowanie i czy ich harmonogram jest skorelowany z czasem awarii.
- Jeśli awaria występuje konsekwentnie, zmień niektóre parametry, aby spróbować zawęzić przyczynę. Na przykład tworzenie kopii zapasowej na innym nośniku docelowym lub tworzenie kopii zapasowych różnych typów danych z tego samego klienta NetWorker
Krok 6: Rozwiązanie
Zrzut rdzenia to plik, który przechwytuje pamięć roboczą procesu w określonym momencie, zwykle gdy program kończy się nieprawidłowo. Zrzut rdzenia pomaga określić, dlaczego proces przestaje odpowiadać, ujawniając funkcje wykonywane i dane używane w momencie awarii.
- Sprawdź kolumnę
/nsr/coresdla ostatnich zrzutów rdzenia procesów NetWorker w systemie UNIX lub Linux lub sprawdź katalog awarii zdefiniowany w rejestrze systemu Windows (patrz krok 2). - Jeśli ich nie ma, sprawdź, czy system operacyjny jest skonfigurowany tak, aby generować pliki zrzutu pamięci rdzenia w przypadku awarii procesu. Szczegółowe informacje można znaleźć w dokumentacji systemu operacyjnego, ale w skrócie oznacza to zmianę
ulimit -ci-fw systemach UNIX i Linux oraz wprowadzanie zmian w rejestrze w systemie Windows. - Narzędzia systemu operacyjnego, takie jak
gdb(UNIX i Linux) orazWinDbg(Windows) może służyć do oceny zrzutu rdzenia. Informacje na temat tych funkcji można znaleźć w dokumentacji dostawcy systemu operacyjnego. - Aby zapoznać się z przeglądem pomocy technicznej NetWorker, zobacz: NetWorker: korzystanie z pkgcore do generowania pakietów zrzutów rdzenia
Dodatkowe informacje
W przypadku korzystania z pomocy technicznej NetWorker w przypadkach związanych ze zrzutem rdzenia należy podać informacje zebrane podczas postępowania zgodnie z tym artykułem. Pakiet NSRGET i zrzut rdzenia pkgcore Należy również dostarczyć pakiety.