NetWorker – Troubleshooting-Handbuch: Prozessabstürze und Core-Speicherabbilder
Summary: Dell NetWorker – umfassendes Handbuch zum Troubleshooting von Prozessabstürzen und Core-Speicherabbildern
Symptoms
NetWorker – Troubleshooting-Handbuch: Prozessabstürze und Core-Speicherabbilder
Video: Dell NetWorker – umfassendes Handbuch zum Troubleshooting von Prozessabstürzen und Core-Speicherabbildern
Auf YouTube ansehen
Cause
Resolution
Überprüfen Sie, ob jeder der unten aufgeführten Schritte zur Fehlerbehebung für Ihre Umgebung geeignet ist. Jeder Schritt enthält Anweisungen oder einen Link zu einem Dokument, um mögliche Ursachen zu beseitigen und bei Bedarf Korrekturmaßnahmen zu ergreifen. Die Schritte folgen der am besten geeignetsten Reihenfolge, um das Problem zu isolieren und die richtige Lösung zu identifizieren. Überspringen Sie keinen Schritt.
Schritt 1: Sammeln von Informationen – Problembeschreibung
- Unter welchen Umständen stürzt der Prozess ab? Ist dieses Verhalten konsistent?
- Hat das vorher besser funktioniert?
- Zeitpunkte des Auftretens und beobachteter Verhaltenstrend
: Tritt das Problem nur bei hoher Auslastung der Backupumgebung oder der Backups oder eines bestimmten Backupgruppentyps auf?
- Wann ist das Problem zum ersten Mal aufgetreten? Was änderte sich dann?
- Was ist der Umfang des Problems (alle Clients/einige Clients, alle Backup-Ziele oder einige)
- Was wurde bisher versucht zu beheben und welche Schlussfolgerungen wurden daraus gezogen.
Schritt 2: Sammeln von Informationen – Umgebung
- NetWorker-Serverversion und -plattform
- Übersicht über die Größe und Art der Backup-Datenzone
- Zielmedien für diese Backups
Schritt 3: Haltbarkeit
- Überprüfen Sie, ob kein zugrunde liegender Betriebssystem- oder Hardwarefehler vorliegt, der für die Prozessabstürze verantwortlich wäre (Festplattenausfälle, volle Festplatte, Netzwerkfehler usw.).
Schritt 4: Best Practices
Schritt 5: Komponentenisolierung
- Überwachung der Systemleistung bei hoher Auslastung
- Überprüfen Sie die Protokolldateien des Betriebssystems zum Zeitpunkt der Abstürze auf Gemeinsamkeiten im Verhalten
. - Lesen Sie den NetWorker-Zeitplan, um festzustellen, ob eine Korrelation zwischen den Zeitpunkten des Auftretens einer bestimmten geplanten NetWorker-Aktivität besteht.
- Finden Sie heraus, welche Nicht-NetWorker-Vorgänge auf diesem Computer ausgeführt werden, die sich auf sein Verhalten auswirken könnten, und ob ihr Zeitplan mit den Zeiten der Abstürze korreliert.
- Wenn der Absturz regelmäßig auftritt, ändern Sie einige Parameter, um die Ursache einzugrenzen. Zum Beispiel das Sichern auf ein anderes Zielmedium oder das Sichern verschiedener Datentypen vom selben NetWorker-Client
Schritt 6: Auflösung
Die meisten Betriebssysteme erzeugen Core-Speicherabbilddateien nicht automatisch. Die Parameter des Betriebssystems müssen geändert werden, damit zum Zeitpunkt eines Prozessabsturzes eine Core-Speicherabbilddatei erzeugt wird. Diese Änderung muss vor dem Absturz durchgeführt werden.
1) Überprüfen Sie das Verzeichnis /nsr/cores auf aktuelle Core-Speicherabbilder von NetWorker-Prozessen unter Unix oder Linux oder überprüfen Sie das Absturzverzeichnis, wie in der Windows-Registrierung definiert (siehe Schritt 2).
2) Wenn keine vorhanden ist, überprüfen Sie, ob das Betriebssystem so eingerichtet ist, dass bei einem Prozessabsturz Core-Speicherabbilddateien erzeugt werden. Ausführliche Informationen finden Sie in der Dokumentation zum Betriebssystem. Kurz gesagt, dazu müssen Sie wahrscheinlich die ulimit-c- und -f-Werte in Linux oder Unix ändern und eine Registrierungsänderung in Windows vornehmen.
Für Windows 2008R2:
- Aktualisieren Sie die Registrierung mit dem neuen Schlüssel, der unter http://msdn.microsoft.com/en-us/library/bb787181(VS.85).aspx bereitgestellt wird.
- Mit den empfohlenen Werten wird die Speicherabbilddatei in C:\Users\Administrator\AppData\Local\CrashDumps
- Vollständige Absturzabbilder aktivieren erstellt.
3) Die Core-Datei kann auf dem Host-Rechner selbst untersucht oder zur Analyse auf einem anderen Rechner gepackt werden. Details zum Verpacken dieser Kerndateien finden Sie hier:
UNIX- und Linux-Kerndateipakete:
489272: So erfassen Sie Core-/Crashdump-Informationen und zugehörige Protokolle
4) Analysieren Sie die verfügbaren Daten:
- Protokolldateien
des Betriebssystems - NetWorker-Daemon-Protokolldatei vom NetWorker-Server und vom relevanten Storage Node.
- Core-Datei oder Absturzdatei
: Die detaillierte Analyse einer Core-Datei erfordert erweiterte Kenntnisse der internen NetWorker-Vorgänge und sollte vom EMC NetWorker-Support durchgeführt werden. Es kann jedoch ein erster Lesevorgang der Core-Datei durchgeführt werden, um den Inhalt der Core-Datei mit bekannten Problemen zu vergleichen.
Linux und HP-UX
gdb [vollständiger Pfad zum Verarbeitung] [Core-Datei]
(gdb) wobei
AIX
dbx [vollständiger Pfad zum Verarbeitung] [core-Datei]
(dbx) wo
Solaris
pstack [Kerndatei]
dbx [vollständiger Pfad zum Verarbeitung] [core-Datei]
(dbx) wobei
Windows
- Starten Sie das Windows-Debugger-Programm
windbg- Klicken Sie auf Datei und öffnen Sie die Speicherabbilddatei in windbg.
- Geben Sie analyze --v in das untere Befehlsfenster ein, um alle Informationen abzurufen.
5) Basierend auf der obigen Analyse und dem Wissen über das Systemverhalten können Sie den Incident mit der Liste bekannter Probleme vergleichen, die in den NetWorker-Versionshinweisen für die neueste Version aufgeführt sind.
Schritt 7: Erweitertes Debugging (falls erforderlich)