NetWorker: Troubleshooting von Bandbibliotheksproblemen in NetWorker
Zusammenfassung: Dieser Artikel soll sowohl dem NetWorker-Support als auch den NetWorker-Backup-Administratoren helfen, Probleme im Zusammenhang mit Bandbibliotheken anzugehen und zu beheben.
Weisungen
Vor der Untersuchung von Bandbibliotheksproblemen ist es wichtig, Folgendes zu berücksichtigen:
- Bandlaufwerke lesen und schreiben Daten und Etiketten auf Medien und stellen alle Medienfunktionen bereit und können die Bandkassetten selbst nicht bewegen
- Bandbibliotheken verschieben Medienbandkassetten von Element zu Element: Laufwerke, Steckplätze und Import- und Export-Ports und lesen oder schreiben keine Daten
Wenn NetWorker-Vorgänge fehlschlagen, weil Bandkassetten nicht bewegt werden können, gibt es mehrere mögliche allgemeine Ursachen:
- Hardware- oder Firmwareproblem mit Bibliotheksroboter oder internen Komponenten
- Konnektivitätsprobleme zwischen NetWorker-Host und Bibliotheksrobotik über Transport
- BS-, Treiber- oder Kompatibilitätsproblem zwischen NetWorker-Host und Bibliothek
- NetWorker-Konfigurationsproblem in Bezug auf Typ, Status und Adressierung der Bandbibliothek
Führen Sie diese Schritte chronologisch aus, um die Art des Problems zu bestimmen und möglicherweise zu beheben. Wenn dieses Dokument das Problem nicht löst, enthält es Tests, die das Problem eingrenzen und einem Spezialisten helfen, die Arbeit fortzusetzen.
1. Umgebungsinformationen
Vom NetWorker-Server und den betroffenen Storage Nodes:
- Hostname, BS-Typ und -Version.
- NetWorker-Version und Build-Nummer.
- Ausgabe der '
inquire' Befehl mit Bändern und Bibliotheken. - Gezippte Kopie der aktuellen
nsrdb(um aktuelle Jukebox-Informationen beizubehalten, falls erforderlich, für Rollback)
Linux:/nsr/res/nsrdb
Windows (Standardeinstellung):C:\Program Files\EMC NetWorker\nsr\res\nsrdb - Storage Node, NetWorker-Name für Bibliothek und Liste der betroffenen Nodes, Geräte und Volumes
- Gemeinsamkeiten des Problems (bestimmte Volumes, bestimmte Laufwerke, bestimmte Nodes usw.)
nsrget -o:d auf dem betroffenen Server und den betroffenen Nodes.
-o:d Auf jedem Host mit Bändern, auf denen die Bänder mit dem Schreiben beschäftigt sind. Sie können dies in der NetWorker Management Console (NMC) unter Monitoring –>Devices überprüfen.
Der folgende Artikel enthält Informationen zum Abrufen und Verwenden von NSRGET: NetWorker: So verwenden Sie das nsrget-NetWorker-Datenerfassungs-Tool
2. Bereitschaft der Bibliothek testen
- Überprüfen Sie, ob der Speicher-Node-Eigentümer der betroffenen Bibliothek aktiviert und bereit ist:
- Navigieren Sie im NMC zu Devices –>Storage Nodes.
- Stellen Sie sicher, dass Ansicht –>Diagnosemodus aktiviert ist.
- Überprüfen Sie die Spalten Aktiviert und Bereit im Bereich auf der rechten Seite.
- Wenn ein Speicher-Node, der aktiviert werden soll, nicht aktiviert ist, klicken Sie mit der rechten Maustaste auf den Speicher-Node und klicken Sie auf Aktivieren/Deaktivieren , um ihn zu aktivieren .
- Wenn der Storage Node in ein oder zwei Minuten nicht bereit ist, müssen Sie separat nachfassen. Die Bibliothek reagiert nicht, da auf den Speicher-Node nicht zugegriffen werden kann.
- Überprüfen Sie, ob die betroffene Bibliothek aktiviert und bereit ist:
- Navigieren Sie im NMC zu Devices –>Libraries.
- Stellen Sie sicher, dass Ansicht –>Diagnosemodus aktiviert ist.
- Überprüfen Sie die Spalten Aktiviert und Bereit im Bereich auf der rechten Seite. Wenn die Bibliothek den Status "Bereit" anzeigt, fahren Sie mit Abschnitt [
4]. - Wenn sie nicht aktiviert ist, können Sie mit der rechten Maustaste auf die Bibliotheksinstanz auf der linken Seite klicken und "Aktivieren/Deaktivieren" auswählen, um sie erneut zu aktivieren.
- Warten Sie nach der Aktivierung ein oder zwei Minuten, klicken Sie erneut auf den Container "Bibliotheken" und prüfen Sie, ob in der Spalte "Bereit" ein grünes Häkchen angezeigt wird.
- Wenn die Bibliothek nicht bereit ist, klicken Sie mit der rechten Maustaste auf die Bibliotheksinstanz auf der linken Seite, wählen Sie Eigenschaften aus und stellen Sie auf der Registerkarte Allgemein sicher, dass der Wert für den Steuerungsport dem
scsidev@#.#.#Adresse, die Sie auf der Seiteinquire. - Wenn der Kontrollport nicht übereinstimmt, setzen Sie Enabled auf No und klicken Sie auf OK. Geben Sie dann die Eigenschaften erneut ein und ändern Sie den Kontrollport so, dass er mit dem übereinstimmt
inquireAdresse ermittelt. Ändern Sie nach der Aktualisierung des Control PortEnabled wieder in Yes und klicken Sie erneut auf OK , um ihn wieder zu aktivieren. Warten Sie ein oder zwei Minuten, um zu sehen, ob die Bibliothek bereit ist. - Wenn nach dem Korrigieren des Werts für den Steuerungsport die Bibliothek nicht in den Status "Ready" wechselt, geben Sie ein letztes Mal Eigenschaften der Bibliothek ein. Legen Sie auf der Registerkarte Erweitert die Debugablaufverfolgungsebene auf 5 fest. und Deaktivieren und erneut aktivieren, um die Startsequenz zwei Minuten lang im Daemon-Protokoll zu erfassen.
Beim erneuten Aktivieren der Bibliothek im Abschnitt [2.2], bestätigen Sie, dass nsrlcpd Startet auf dem vorgesehenen Speicher-Node. Stellen Sie außerdem sicher, dass er nicht unabhängig voneinander angehalten oder neu gestartet wird. Wenn sich die Prozess-ID (PID) weiterhin ändert, deutet dies darauf hin, dass der Prozess von der Software oder dem Speicherabbild-Core gestoppt oder beendet wurde. Achten Sie auch auf Probleme mit der Namensauflösung zwischen Server und Storage Node, die Starts verhindern können. Der Name, den der Server für den Node auflöst, sollte mit dem eigenen nsrladb-Namen des Nodes und dem Servernamen des Node übereinstimmen.
- Erweiterte Informationen zur Bereitschaft von Bibliotheken finden Sie unter Troubleshooting von Problemen mit der Bandbibliotheksbereitschaft in NetWorker .
- Weitere Informationen finden Sie im NetWorker-Troubleshooting-Handbuch: Verarbeiten Sie Abstürze und Core-Speicherabbilder, wenn Sie sehen oder vermuten, dass die
nsrexecd,nsrsnmdodernsrlcpdsind Kern-Dumping.
Eine detaillierte Übersicht über die Prozesse von NetWorker pro Host finden Sie unter: NetWorker-Prozesse und -Ports
Meldungen zu diesen Services werden in der daemon.rawverwalten:
- Linux:
/nsr/logs/daemon.raw - Windows (Standardeinstellung):
C:\Program Files\EMC NetWorker\nsr\logs\daemon.raw - NetWorker: So verwenden Sie nsr_render_log zum Rendern .raw Protokolldateien
3. Bestimmen Sie die Reaktionsfähigkeit der Bibliothek:
Wenn die Bibliothek nicht bereit ist und Sie keine Ursache feststellen können, stellen Sie sicher, dass die Bibliothek selbst kontaktiert werden kann:
- Überprüfen Sie die Spalte
inquireAusgabe des Knotens von [1.3] und stellen Sie sicher, dass die Bibliothek in der Ausgabe als 'Autochanger' angezeigt wird, und notieren Sie den SCSI-Wert#.#.#Adresse. - Wenn die Bibliothek nicht in der
inquireÜberprüfen Sie, ob das Betriebssystem sie erkennen kann. Solaris-Hosts melden die Bibliothek nicht, wenn sie in NetWorker konfiguriert und aktiviert ist. Weitere Informationen finden Sie unter Troubleshooting von Problemen bei der Bandbibliothekserkennung in NetWorker. - Stellen Sie sicher, dass die Bibliothek auf grundlegende Bibliotheksbefehle reagiert. Verwenden der SCSI-Adresse in [
3.1], führen Sie Folgendes aus: 'sjisn #.#.#'. Weitere Informationen zu Bibliothekstestbefehlen finden Sie unter Troubleshooting von Problemen beim Zugriff auf Bandbibliotheken in NetWorker. - Wenn die SJI-Befehle fehlschlagen, sollten Sie die Möglichkeit von Transport- oder Hardwareproblemen in Betracht ziehen: Weitere Informationen finden Sie unter Troubleshooting von Bandbibliothek-Hardwareproblemen in NetWorker .
- Wenn das Problem darin besteht, dass das Betriebssystem die Bibliothek nicht erkennt und nicht ordnungsgemäß auf SJI-Befehle reagiert und NetWorker nicht ermittelt werden kann, versuchen Sie es mit dem Befehl
jbconfigBefehl und Auswahl von Option 2; Wenn dies nicht funktioniert, versuchen Sie es mit Option 4, geben Sie die Bibliotheksadresse manuell an und konfigurieren Sie sie als Standardbibliothek (Option 56). Weitere Informationen finden Sie unter Troubleshooting von Bandbibliothekskonfigurationsproblemen in NetWorker .
4. Testen der Bandbewegung und des Volume-Funktionszustands
Wenn die Bibliothek bereit ist und zu reagieren scheint, aber Probleme beim Laden von Volumes hat, gibt es viele verschiedene mögliche Ursachen.
- Leeren Sie die gesamte Bibliothek, wenn irgend möglich; Wenn Sie andere Vorgänge beenden können, klicken Sie mit der rechten Maustaste auf die Registerkarte Geräte ->Bibliotheken und setzen Sie die Bibliothek zurück.
- Versuchen Sie, eine einzelne Bandkassette in ein einzelnes Gerät zu laden, wobei davon ausgegangen wird, dass beide von Ladeproblemen betroffen sind. Entladen Sie nach jedem Versuch nach Bedarf.
- Vergleichen Sie sie mit dem gleichen Volume in verschiedenen Laufwerken und verschiedenen Volumes auf dem Laufwerk, von denen angenommen wird, dass sie betroffen sind. Notieren Sie sich die Fehler und ggf. Muster.
- Wenn das Laden des Volumes unabhängig vom Gerät zuverlässig fehlschlägt, versuchen Sie die folgende Etikettierungsprüfung:
- Laden des Volume ohne Mounten Wenn sich die Bandkassette ohne Fehler bewegt, haben Sie überprüft, dass der Arm mechanisch funktioniert.
- Führen Sie
nsrmm -pv -f networker_deviceWenn er mit einem verifizierten Etikett antwortet, haben Sie sich vergewissert, dass der Datenträger ebenfalls gültig und fehlerfrei ist. - Navigieren Sie in den Eigenschaften der Bibliothek bei aktiviertem Diagnosemodus zur Registerkarte Timer und legen Sie Load Sleep auf 60 fest, bevor Sie auf OK klicken.
- Entladen Sie das Volume und versuchen Sie dann, das Volume neu zu laden. Wenn dies jetzt erfolgreich ist, war das Problem wahrscheinlich ein Timing-Problem (Sie können mit niedrigeren Ruhezustandswerten experimentieren, bis es wieder fehlschlägt).
- Wenn die
nsrmmDer Befehl ist fehlgeschlagen, weitere Tests sind erforderlich. Deaktivieren Sie das entsprechende Laufwerk in NMC, indem Sie mit der rechten Maustaste klicken und Enable/Disable auswählen.- Führen Sie
scannerBefehl auf dem Gerät:- Führen Sie für den lokalen Speicher-Node des NetWorker-Servers Folgendes aus:
scanner -nizv local_device - Führen Sie für auf einem "Remote"-NetWorker-Storage-Node Folgendes aus:
scanner -s server -nizv local_device
- Führen Sie für den lokalen Speicher-Node des NetWorker-Servers Folgendes aus:
- Unterbrechen Sie nach ~20 Zeilen und überprüfen Sie die Etikett-Lesemeldung. Der Erfolg wird angezeigt durch
8936:scanner: scanning media_type tape volume_name on device_name. - Wenn
scannergibt die Meldung unexpected file number, wanted 2, got higher_number Datenverlust aus, höchstwahrscheinlich aufgrund von SCSI-Reset; Überprüfen Sie Troubleshooting von überschriebenen Labels und SCSI-Zurücksetzungen in NetWorker.
- Führen Sie
- Wenn die
scannerGibt einenmessage 8945:scanner: Read: -1 bytesStellen Sie fest, ob das Volume auf anderen Nodes oder Laufwerken gelesen werden kann, und ermitteln Sie die Entwicklung des Problems. Wenn Sie feststellen, dass einige Volumes auf einigen Nodes gelesen werden können, auf anderen jedoch nicht, und das Gerät LTO-4 oder höher ist, sollten Sie Laufwerksentschlüsselungsfehler in Betracht ziehen: LTO-Hardwareverschlüsselung und NetWorker.
Weitere Informationen zur erweiterten Medienüberprüfung finden Sie unter: Troubleshooting bei Problemen beim Mounten von Datenträgern in NetWorker.
5. Testen auf Probleme bei der Laufwerksreihenfolge
Wenn Lade- und Mountbefehle erfolgreich sind, aber Labellesevorgänge oder einfache Mounts fehlschlagen, kann das Problem eine falsche Laufwerksreihenfolge beinhalten.
- Leeren Sie die gesamte Bibliothek, wenn irgend möglich; Wenn Sie andere Vorgänge beenden können, klicken Sie mit der rechten Maustaste auf und setzen Sie die Bibliothek über Geräte –>Bibliothekenzurück.
- Versuchen Sie, eine einzelne Bandkassette in ein einzelnes Gerät zu laden, wobei davon ausgegangen wird, dass beide von Ladeproblemen betroffen sind. Entladen Sie nach jedem Versuch nach Bedarf.
- Vergleichen Sie sie mit dem gleichen Volume in verschiedenen Laufwerken und verschiedenen Volumes auf dem Laufwerk, von denen angenommen wird, dass sie betroffen sind. Notieren Sie sich die Fehler und ggf. Muster.
- Wenn ein Ladevorgang zuverlässig fehlschlägt, versuchen Sie es mit der folgenden Etikettierungsprüfung:
Erweiterte Unterstützung bei Problemen beim Laden von Bibliotheken finden Sie unter: Troubleshooting von Problemen beim Laden der Bandbibliothek in NetWorker.
Wenn alle diese Tests fehlgeschlagen sind und Sie nicht weiterarbeiten, dokumentieren Sie Ihre Ergebnisse für jeden Schritt in diesem Artikel und wenden Sie sich an den NetWorker-Support. Klare Details sind unerlässlich, um Lösungen zu beschleunigen und sicherzustellen, dass "wiederholte Schritte" begrenzt sind.