NetWorker: Rozwiązywanie problemów z biblioteką taśmową w NetWorker
Podsumowanie: Ten artykuł ma na celu pomóc zarówno pomocy technicznej NetWorker, jak i administratorom kopii zapasowych NetWorker w rozwiązywaniu problemów związanych z bibliotekami taśmowymi.
Instrukcje
Przed przystąpieniem do badania problemów z biblioteką taśmową należy wziąć pod uwagę następujące kwestie:
- NAPĘDY TAŚMOWE odczytują i zapisują dane i etykiety na nośnikach i zapewniają wszystkie funkcje nośnika, ale nie mogą same przenosić kaset z taśmami
- BIBLIOTEKI taśm przenoszą kasety z taśmą nośnikową z elementu do elementu: Dyski, gniazda oraz porty importu i eksportu, bez odczytu i zapisu żadnych danych
Jeśli operacje NetWorker kończą się niepowodzeniem z powodu niemożności przeniesienia kaset z taśmami, istnieje kilka ogólnych przyczyn:
- Problem ze sprzętem lub oprogramowaniem wewnętrznym robota bibliotecznego lub elementów wewnętrznych
- Problemy z łącznością między hostem NetWorker a robotyką biblioteczną za pośrednictwem transportu
- Problem z systemem operacyjnym, sterownikiem lub zgodnością między hostem NetWorker a biblioteką
- Problem z konfiguracją NetWorker dotyczący typu, stanu i adresowania biblioteki taśmowej
Postępuj zgodnie z poniższymi krokami chronologicznie, aby pomóc określić naturę problemu i ewentualnie go rozwiązać. Jeśli ten dokument nie rozwiąże problemu, zawiera testy, które zawężają problem i pomagają specjaliście kontynuować pracę.
1. Informacja środowiskowa
Z serwera NetWorker i węzłów pamięci masowej, których dotyczy problem:
- Nazwa hosta, typ systemu operacyjnego i wersja.
- Numer wersji i kompilacji NetWorker.
- Wyjście "
inquire' pokazujące taśmy i biblioteki. - Spakowana kopia bieżącego pliku
nsrdb(aby w razie potrzeby zachować bieżące informacje o szafie grającej w celu cofnięcia)
Linux:/nsr/res/nsrdb
Windows (domyślnie):C:\Program Files\EMC NetWorker\nsr\res\nsrdb - Węzeł pamięci masowej, nazwa NetWorker dla biblioteki oraz lista węzłów, urządzeń i woluminów, których dotyczy problem
- Typowe cechy problemu (określone woluminy, określone dyski, określone węzły itp.)
nsrget -o:d na serwerze i węzłach, których dotyczy problem.
-o:d na każdym hoście z taśmami, na których taśmy są zajęte pisaniem. Można to sprawdzić w konsoli NetWorker Management Console (NMC) w sekcji Monitoring –>Devices.
Poniższy artykuł zawiera informacje na temat uzyskiwania i używania NSRGET: NetWorker: Korzystanie z narzędzia gromadzenia danych NSRGet NetWorker
2. Gotowość testowa biblioteki
- Sprawdź, czy właściciel węzła pamięci masowej biblioteki, której dotyczy problem, jest włączony i gotowy:
- W NMC przejdź do opcji Devices –>Storage Nodes.
- Upewnij się, że włączony jest tryb diagnostycznyWidok.>
- Sprawdź kolumny Włączone i Gotowe w okienku po prawej stronie.
- Jeśli węzeł pamięci masowej, który ma być włączony, nie jest włączony, kliknij prawym przyciskiem myszy węzeł pamięci masowej i kliknij opcję Włącz/Wyłącz , aby go włączyć .
- Jeśli węzeł pamięci masowej nie będzie gotowy w ciągu minuty lub dwóch, należy podjąć oddzielne działania następcze. biblioteka nie reaguje, ponieważ jej węzeł pamięci masowej jest niedostępny.
- Sprawdź, czy biblioteka, której dotyczy problem, jest włączona i gotowa do pracy:
- W NMC przejdź do opcji Devices ->Libraries.
- Upewnij się, że włączony jest tryb diagnostycznyWidok.>
- Sprawdź kolumny Włączone i Gotowe w okienku po prawej stronie. Jeśli biblioteka wyświetla stan Gotowe , przejdź do sekcji [
4]. - Jeśli nie jest włączona, możesz kliknąć prawym przyciskiem myszy instancję biblioteki po lewej stronie i wybrać "Włącz/Wyłącz", aby ją ponownie włączyć.
- Po włączeniu poczekaj minutę lub dwie, kliknij ponownie kontener Biblioteki i sprawdź, czy w kolumnie "Gotowe" pojawi się zielony haczyk.
- Jeśli biblioteka nie jest gotowa, kliknij prawym przyciskiem myszy instancję biblioteki po lewej stronie, wybierz Właściwości, a na karcie Ogólne upewnij się, że wartość Port sterowania jest zgodna z wartością
scsidev@#.#.#adres, który widzisz winquire. - Jeśli port sterowania nie pasuje, ustaw opcję Włączone na Nie i kliknij przycisk OK; następnie ponownie wprowadź właściwości i zmień Port sterowania , aby pasował do
inquireWykryto adres. Po zaktualizowaniu portu sterowania zmień wartość Włączone z powrotem na Tak i kliknij ponownie przycisk OK , aby włączyć ją ponownie. Poczekaj minutę lub dwie, aby sprawdzić, czy biblioteka jest gotowa. - Na koniec, jeśli po poprawieniu wartości Control Port nie pozwala na to, aby biblioteka stała się gotowa, wprowadź właściwości biblioteki po raz ostatni; na karcie Zaawansowane ustaw poziom śledzenia debugowania na 5; oraz Wyłącz i włącz ponownie , aby przechwycić sekwencję startową w dzienniku demona przez dwie minuty.
Podczas ponownego włączania biblioteki w sekcji [2.2], potwierdzenie, że nsrlcpd Rozpoczyna się od zamierzonego węzła pamięci masowej. Sprawdź również, czy nie zatrzymuje się lub nie uruchamia ponownie niezależnie. Jeśli identyfikator procesu (PID) nadal się zmienia, sugeruje to, że proces został zatrzymany lub zabity przez oprogramowanie lub rdzeń zrzutowy. Należy również pamiętać o problemach z rozpoznawaniem nazw między serwerem a węzłem pamięci masowej, które mogą uniemożliwić uruchomienie. Nazwa, którą serwer rozpoznaje dla węzła, powinna być zgodna z własną nazwą nsrladb węzła i nazwą serwera dla węzła.
- Szczegółowe informacje na temat rozwiązywania problemów z gotowością biblioteki taśmowej można znaleźć w sekcji Rozwiązywanie problemów z gotowością biblioteki taśmowej w oprogramowaniu NetWorker .
- Zapoznaj się z instrukcją rozwiązywania problemów z NetWorker: Awarie procesów i zrzuty rdzenia, jeśli widzisz lub podejrzewasz, że
nsrexecd,nsrsnmdlubnsrlcpdsą dumpingiem podstawowym.
Aby uzyskać szczegółowe omówienie procesów NetWorker poszczególnych hostów, zobacz: Procesy i porty NetWorker
Komunikaty dotyczące tych usług są rejestrowane w katalogu hosta daemon.raw:
- Linux:
/nsr/logs/daemon.raw - Windows (domyślnie):
C:\Program Files\EMC NetWorker\nsr\logs\daemon.raw - NetWorker: Jak używać nsr_render_log do renderowania plików dziennika .raw
3. Określ czas odpowiedzi biblioteki:
Jeśli biblioteka nie jest gotowa i nie można ustalić przyczyny, upewnij się, że można się z nią skontaktować:
- Sprawdź kolumnę
inquiredane wyjściowe węzła z [1.3] i upewnij się, że biblioteka pojawia się w danych wyjściowych jako 'Autochanger', a następnie zanotuj SCSI#.#.#Adres. - Jeśli biblioteka nie pojawia się w oknie
inquiresprawdź, czy system operacyjny może go wykryć. Hosty z systemem Solaris nie zgłaszają biblioteki, jeśli jest ona skonfigurowana i włączona w NetWorker. Aby uzyskać pomoc, zobacz Rozwiązywanie problemów z wykrywaniem biblioteki taśmowej w programie NetWorker. - Upewnij się, że biblioteka reaguje na podstawowe polecenia biblioteki. Korzystanie z adresu SCSI w [
3.1], uruchom: 'sjisn #.#.#'. Aby uzyskać więcej informacji na temat poleceń testowania biblioteki, zapoznaj się z sekcją Rozwiązywanie problemów z dostępem do biblioteki taśmowej w programie NetWorker. - Jeśli polecenia SJI zawiodą, rozważ możliwość problemów z transportem lub sprzętem: Aby uzyskać pomoc, patrz Rozwiązywanie problemów ze sprzętem biblioteki taśmowej w NetWorker .
- Jeśli problem polega na tym, że system operacyjny nie wykrywa biblioteki i poprawnie reaguje na polecenia SJI, NetWorker nie wykrywa, spróbuj użyć
jbconfigpolecenie i wybranie opcji 2; Jeśli to nie zadziała, wypróbuj opcję 4, ręcznie podaj adres biblioteki i skonfiguruj ją jako bibliotekę standardową (opcja 56). Aby uzyskać więcej informacji, zobacz Rozwiązywanie problemów z konfiguracją biblioteki taśmowej w NetWorker .
4. Przetestuj stan ruchu i objętości taśmy
Jeśli biblioteka jest gotowa i wydaje się odpowiadać, ale ma problemy z ładowaniem woluminów, istnieje wiele różnych możliwych przyczyn.
- Opróżnij całą bibliotekę, jeśli to w ogóle możliwe; jeśli możesz zatrzymać inne operacje, kliknij prawym przyciskiem myszy i zresetuj bibliotekę na karcie Urządzenia ->Biblioteki .
- Spróbuj załadować pojedynczą kasetę z taśmą do jednego urządzenia, w którym prawdopodobnie występują problemy z obciążeniem; W razie potrzeby rozładowuj po każdej próbie.
- Porównaj ten sam wolumin na różnych dyskach i różne woluminy na dysku, którego prawdopodobnie dotyczy problem; Zwróć uwagę na ewentualne błędy i wzorce.
- Jeśli ładowanie woluminu niezawodnie zakończy się niepowodzeniem, niezależnie od urządzenia, spróbuj sprawdzić następujące etykiety:
- Załaduj objętość bez montażu Jeśli kaseta z taśmą porusza się bezbłędnie, oznacza to, że ramię jest sprawne mechanicznie.
- Uruchom
nsrmm -pv -f networker_deviceJeśli odpowiedź ma zweryfikowaną etykietę, oznacza to, że nośnik jest prawidłowy i sprawny. - We właściwościach biblioteki, z włączonym trybem diagnostycznym, przejdź do zakładki Timery i ustaw opcję Load Sleep na 60 przed kliknięciem przycisku OK.
- Rozładuj wolumin, a następnie spróbuj ponownie załadować wolumin, jeśli to się powiedzie. Prawdopodobnie problem dotyczył chronometrażu (możesz eksperymentować z niższymi wartościami uśpienia, dopóki ponowne niepowodzenie nie zacznie działać).
- Jeśli wartość
nsrmmPolecenie nie powiodło się, wymagane są dalsze testy. Wyłącz dany dysk w NMC, klikając prawym przyciskiem myszy i wybierając opcję Włącz/Wyłącz.- Uruchom
scannerPolecenie na urządzeniu:- W przypadku lokalnego węzła pamięci masowej serwera NetWorker uruchom:
scanner -nizv local_device - W przypadku "zdalnego" węzła pamięci masowej NetWorker uruchom:
scanner -s server -nizv local_device
- W przypadku lokalnego węzła pamięci masowej serwera NetWorker uruchom:
- Przerwij po ~20 liniach i sprawdź, czy etykieta odczytuje komunikat; O sukcesie świadczy
8936:scanner: scanning media_type tape volume_name on device_name. - jeśli nie ustawiono
scannerzwraca komunikat nieoczekiwany numer pliku, poszukiwany 2, got higher_number nastąpiła utrata danych, najprawdopodobniej z powodu resetu SCSI; zaznacz opcję Rozwiązywanie problemów z nadpisanymi etykietami i resetowaniem SCSI w NetWorker.
- Uruchom
- Jeśli wartość
scannerZwraca wartośćmessage 8945:scanner: Read: -1 bytesOkreśl, czy wolumin może być odczytany na innych węzłach lub dyskach, a następnie określ trend problemu. Jeśli okaże się, że niektóre woluminy mogą być odczytywane na niektórych węzłach, ale nie na innych, a urządzenie jest LTO-4 lub nowsze, rozważ błędy odszyfrowywania dysku: Szyfrowanie sprzętowe LTO i NetWorker.
Aby uzyskać bardziej zaawansowane informacje na temat weryfikacji nośników, zobacz: Rozwiązywanie problemów z montowaniem nośników w oprogramowaniu NetWorker.
5. Test problemów z kolejnością dysków
Jeśli polecenia ładowania i montowania powiodą się, ale odczyt etykiet lub proste montowanie zakończy się niepowodzeniem, problem może dotyczyć nieprawidłowej kolejności dysków.
- Opróżnij całą bibliotekę, jeśli to w ogóle możliwe; jeśli możesz zatrzymać inne operacje, kliknij prawym przyciskiem myszy i zresetuj bibliotekę z menu Urządzenia ->Biblioteki.
- Spróbuj załadować pojedynczą kasetę z taśmą do jednego urządzenia, w którym prawdopodobnie występują problemy z obciążeniem; W razie potrzeby rozładowuj po każdej próbie.
- Porównaj ten sam wolumin na różnych dyskach i różne woluminy na dysku, którego prawdopodobnie dotyczy problem; Zwróć uwagę na ewentualne błędy i wzorce.
- Jeśli ładowanie niezawodnie ulegnie awarii, spróbuj sprawdzić etykietę w następujący sposób:
Aby uzyskać bardziej zaawansowaną pomoc w przypadku problemów z ładowaniem bibliotek, zobacz: Rozwiązywanie problemów z ładowaniem biblioteki taśmowej w programie NetWorker.
Jeśli wszystkie te testy zakończyły się niepowodzeniem, należy udokumentować wyniki dla każdego kroku opisanego w tym artykule i skontaktować się z pomocą techniczną NetWorker. Jasne szczegóły są niezbędne do przyspieszenia rozwiązań i zapewnienia, że "powtarzające się kroki" są ograniczone.