Metro-Node: So erfassen Sie Protokolle vom Metro Node
Summary: In diesem Artikel werden die Schritte zum Erfassen von Protokollen vom Metro Node beschrieben und es wird auch erläutert, welche Protokolle/Daten möglicherweise für ein Performanceproblem benötigt werden. ...
Instructions
Schritte zum Ausführen der folgenden Aufgaben:
- Welche Protokolle sind erforderlich, um Metro-Node-Probleme zu beheben?
- Wie erfasse ich "collect-diagnostics" auf einem Metro Node-Cluster?
- So validieren Sie die vorhandenen collect-diagnostics-Pakete auf den Management-Servern.
- Abbrechen und Bereinigen einer laufenden Erfassungsdiagnose in einem Metro Node
Ein. Welche Protokolle sind erforderlich, um Metro-Node-Probleme zu beheben?
-
Der Befehl, der zum Erfassen von Protokollen vom Metro Node erforderlich ist, heißt "collect-diagnostics" und kann von jedem Node (*1) im Metro Node-Setup ausgeführt werden. Die Ausführung dieses Befehls auf einem Director eines Metro Node-Clusters sollte über alle Daten von allen Directors von allen Nodes eines Clusters verfügen. Führen Sie diesen Befehl NICHT auf mehr als einem Node gleichzeitig aus.
*1 HINWEIS: Führen Sie den Befehl "collect-diagnostics" von nur einem Director auf nur einem Cluster aus, wenn es sich um eine Metro-Konfiguration handelt, und warten Sie, bis der vollständige Abschluss abgeschlossen ist, bevor Sie bei Bedarf die CDs von einem anderen Director oder vom Peer-Cluster erfassen. -
Mit dem Befehl „collect-diagnostics“ wird eine komprimierte tar.gz-Protokolldatei erstellt, die Konfigurations- und Protokolldateien enthält. Die collect-diagnostics-Datei wird im Verzeichnis „/diag/collect-diagnostics-out/“ auf dem Node gespeichert, auf dem sie ausgeführt wurde. Sobald der Befehl abgeschlossen ist, verwenden Sie WINSCP oder ein entsprechendes SCP-Dienstprogramm, um die Datei vom Node zu kopieren, damit sie dem Support für die Analyse zur Verfügung gestellt werden kann. Weitere Informationen zur Verwendung dieses Befehls finden Sie in Abschnitt B unten.
Hinweise:- Wenn der Befehl „collect-diagnostics“ ohne Optionen ausgeführt wird, werden zwei Dateien erzeugt, eine Basisdatei und eine erweiterte Datei. Dies kann auf skalierten Systemen ziemlich lange dauern.
- Für die Unterstützung von Metro Node ist in der Regel nur die Basisdatei erforderlich, bei Leistungsproblemen kann jedoch auch die erweiterte Datei angefordert werden.
- Standardoptionen, die beim Ausführen von „collect-diagnostics“ verwendet werden können, sind:
- “
--noextended": Diese Option lässt die Erfassung erweiterter Diagnosen aus. - “
--last-logs": Mit dieser Option werden Protokolle erfasst, die x Stunden oder Tage zurückliegen.
- “
- Für weitere Details zum Befehl können Sie "collect-diagnostics -h" eingeben
Dies sind Beispiele dafür, wie diese beiden Dateinamen aussehen. Das Datum und die Uhrzeit, die als YYYY-MM-DD-HH.MM.SS angezeigt werden, stammen von dem Datum und der Uhrzeit, zu der diese erfasst wurden:
- Basisdatei:
<Serial number>-c1-diag-YYYY-MM-DD-HH.MM.SS.tar.gz - Erweiterte Datei:
<Serial number>-c1-diag-ext-YYYY-MM-DD-HH.MM.SS.tar.gz
-
Performanceprobleme sind komplex und erfordern die Erfassung vieler spezifischer Informationen. Daher verwenden wir einen Performancefragebogen, den KundInnen ausfüllen müssen, um diesen Prozess zu beschleunigen. Den Fragebogen finden Sie im Anhang am Ende dieses Wissensdatenbank-Artikels.
-
Bei einigen Arten von Performanceproblemen ist es hilfreich, ein zusätzliches Protokoll namens "fe_perf_stats" zu erfassen. Die Protokolle werden kontinuierlich erzeugt, aber nicht von „collect-diagnostics“ erfasst. Um dieses Protokoll zu erfassen, wechseln Sie mit cd (Verzeichnis) zu /var/log/VPlex/cli auf einem Node aus jedem Cluster und führen Sie den Befehl "tar cvzf fe-perf-stats.tar.gz fe_perf_stats*" aus, um die Daten der Dateien in eine tar-Datei zu komprimieren. Stellen Sie mit WINSCP oder einem gleichwertigen SCP-Dienstprogramm eine Verbindung zum Node her und navigieren Sie zu /var/log/VPlex/cli. Kopieren Sie die Datei "fe-perf-stats.tar.gz" auf Ihr System. Laden Sie die tar-Datei zusammen mit einer oder mehreren collect-diagnostics-Dateien, falls vom Support angefordert, in den SR oder einen FTP-Link hoch, den der Support Ihnen im SR und in einer E-Mail bereitstellt.
-
Zusätzlich zur Erfassung von Diagnosen kann es hilfreich sein, die folgenden Informationen zu erfassen:
- Öffnen Sie die Protokollierung für eine PuTTY-Sitzung,
- Führen Sie dann die folgenden Befehle aus.
- Sammeln Sie dann das PuTTY-Protokoll und laden Sie es auf Ihr System herunter.
- Hängen Sie dann das PuTTY-Protokoll, die collect-diagnostics und alle anderen angeforderten Daten an den SR an.
Die folgenden Befehle müssen über die VPlexcli-Eingabeaufforderung ausgeführt werden.
cluster statusll clusters/**/storage-views/* --fullll ~portsshow-use-hierarchy /clusters/**/virtual-volumes/*ll ~system-volumesls -t /clusters/*/directors/*::serial-number(Dieser Befehl listet alle DSTs für jeden Node auf.)ls -t /clusters/**/director-*/::hostname(Bei den angezeigten Hostnamen handelt es sich um die IP-Adressen, dies ist zu erwarten.)
B. Wie erfasse ich "collect-diagnostics" auf einem Metro Node-Cluster?
Um diese Daten zu erfassen, führen Sie den Befehl „collect-diagnostics“ mit den Flags „--noextended“ und „--last-logs 30d“ aus.
-
Stellen Sie eine SSH-Sitzung bei der Linux-Eingabeaufforderung eines Director-Node her, z. B. service@director-1-1-a, und melden Sie sich dann bei der vplexcli an.
Beispielausgabe:
login as: service Keyboard-interactive authentication prompts from server: | Password: End of keyboard-interactive prompts from server Last login: <date and timestamp data> from x.x.x.x service@director-1-1-a:~> service@director-1-1-a:~> vplexcli Trying ::1... Connected to localhost. Escape character is '^]'. VPlexcli:/>
-
Um die „collect-diagnostics“ zu starten, führen Sie in der VPlexcli-Eingabeaufforderung den Befehl „collect-diagnostics“ mit den angegebenen Optionen aus, wie im folgenden Beispiel gezeigt.
Ausgabebeispiel:
VPlexcli:/> collect-diagnostics --noextended --last-logs 30d ('WARNING:The collect-diagnostics command was issued with option --noextended. ',) The following file(s) will NOT be collected: core files fast trace dump files slow trace dump files udcom trace dump files udcom legacy trace files user-defined performance sink files the management console's heap ('WARNING:Only the logs that are generated in the last 30 days are collected.') 2024-02-09 19:55:12 UTC: ****Initializing collect-diagnostics... 2024-02-09 19:55:13 UTC: No cluster-witness server found. 2024-02-09 19:55:13 UTC: Free space = 88G 2024-02-09 19:55:13 UTC: Total space needed = 1907M ================================================================================ Starting collect-diagnostics, this operation might take a while... ================================================================================ Executing cluster collection ..
C. So validieren Sie die vorhandenen collect-diagnostics-Pakete auf dem Director/Node.
-
Wenn der Befehl "collect-diagnostics" abgeschlossen ist und zur vplexcli-Eingabeaufforderung zurückkehrt, stellen Sie mit winscp [oder einem gleichwertigen SCP-Dienstprogramm] eine Verbindung zu dem Director her, auf dem Sie den Befehl ausgeführt haben, und navigieren Sie zum Ordner /diag/collect-diagnostics-out/.
-
Identifizieren Sie eine oder mehrere Protokolldateien mit dem richtigen Zeitstempel und laden Sie sie auf Ihre lokale Workstation herunter.
D. Abbrechen einer laufenden Erfassungsdiagnose
-
Wenn Sie sich noch in der PuTTY-Sitzung befinden, in der Sie die „collect-diagnostics“ gestartet haben, sollten Sie die laufende Ausgabe des Tools sehen – das zeigt, dass es noch aktiv ist.
Beispielausgabe:
VPlexcli:/> collect-diagnostics --noextended --last-logs 30d ('WARNING:The collect-diagnostics command was issued with option --noextended. ',) The following file(s) will NOT be collected: core files fast trace dump files slow trace dump files udcom trace dump files udcom legacy trace files user-defined performance sink files the management console's heap ('WARNING:Only the logs that are generated in the last 30 days are collected.') 2022-02-09 19:55:12 UTC: ****Initializing collect-diagnostics... 2022-02-09 19:55:13 UTC: No cluster-witness server found. 2022-02-09 19:55:13 UTC: Free space = 88G 2022-02-09 19:55:13 UTC: Total space needed = 1907M ================================================================================ Starting collect-diagnostics, this operation might take a while... ================================================================================ Executing cluster collection .. -
Öffnen Sie eine weitere PuTTY-Sitzung und melden Sie sich mit dem Servicekonto bei dem Director an, auf dem Sie die „collect-diagnostics“ gestartet haben.
Beispielausgabe:
login as: service Using keyboard-interactive authentication. Password: Last login: <date and time stamp data> from x.x.x.x service@director-1-1-b:~>
-
Sobald Sie sich auf dem Director befinden, starten Sie die Managementkonsole mit dem folgenden Befehl neu, um die ausgeführte "collect-diagnostics" abzubrechen.
Beispielausgabe:
service@director-1-1-b:~> sudo systemctl restart VPlexManagementConsole.service
-
Wenn Sie auf die erste PuTTY-Sitzung zurückblicken, in der "collect-diagnostics" ausgeführt wird, wenn Sie die Verwaltungskonsole neu gestartet haben, sollte "collect-diagnostics" Folgendes als letzte notierte Ausgabe angezeigt werden:
"Connection closed by foreign host."
Beispielausgabe (überprüfen Sie die letzte Zeile der Ausgabe):
VPlexcli:/> collect-diagnostics --noextended --last-logs 30d ('WARNING:The collect-diagnostics command was issued with option --noextended. ',) The following file(s) will NOT be collected: core files fast trace dump files slow trace dump files udcom trace dump files udcom legacy trace files user-defined performance sink files the management console's heap ('WARNING:Only the logs that are generated in the last 30 days are collected.') 2022-02-09 20:02:03 UTC: ****Initializing collect-diagnostics... 2022-02-09 20:02:04 UTC: No cluster-witness server found. 2022-02-09 20:02:04 UTC: Free space = 88G 2022-02-09 20:02:04 UTC: Total space needed = 1907M ================================================================================ Starting collect-diagnostics, this operation might take a while... ================================================================================ Executing cluster collection .. ERROR Executing SMS log collection .. Connection closed by foreign host. <<< -
Sobald "collect-diagnostics" gestoppt wurde, gehen Sie in Schritt 3 oben zurück zur zweiten PuTTY-Sitzung und wechseln Sie mit "cd" in das Verzeichnis /diag, führen Sie dann "ll" aus, und Sie sollten einige zusätzliche Verzeichnisse sehen.
collect-diagnostics-tmpcollect-diagnostics-jobscollect-diagnostics-tmp-ext*
* wenn erweiterte Dateien nicht übersprungen wurden
Beispielausgabe:
service@director-1-1-b:/diag> ll total 32 drwxr-xr-x 2 service groupSvc 4096 Feb 9 20:03 collect-diagnostics-tmp-ext drwxr-xr-x 2 service groupSvc 4096 Feb 9 20:03 collect-diagnostics-jobs drwxr-xr-x 2 service groupSvc 4096 Feb 9 20:04 collect-diagnostics-out drwxr-xr-x 3 service groupSvc 4096 Feb 9 20:02 collect-diagnostics-tmp drwx------ 2 root root 16384 Jan 27 16:54 lost+found drwx--x--x 3 service groupSvc 4096 Dec 17 03:08 share service@director-1-1-b:/diag>
-
Wenn Sie in jedes dieser Verzeichnisse schauen, sehen Sie Dateien mit dem Datum und der Uhrzeit, zu der Sie die jetzt abgebrochene collect-diagnostics gestartet haben. Diese Dateien belegen Speicherplatz in der /diag-Partition und sollten entfernt werden.
-
Um die Dateien aus dem /diag-Verzeichnis zu entfernen/zu löschen, geben Sie "rm -r collect-diagnostics-jobs" und "rm -r collect-diagnostics-tmp" ein. Geben Sie dann erneut "ll" ein, um sicherzustellen, dass die Verzeichnisse gelöscht oder entfernt wurden.
Beispielausgabe:
service@director-1-1-b:/diag> rm -r collect-diagnostics-jobs service@director-1-1-b:/diag> rm -r collect-diagnostics-tmp service@director-1-1-b:/diag> ll total 24 drwxr-xr-x 2 service groupSvc 4096 Feb 9 20:04 collect-diagnostics-out drwx------ 2 root root 16384 Jan 27 16:54 lost+found drwx--x--x 3 service groupSvc 4096 Dec 17 03:08 share service@director-1-1-b:/diag>
-
Wenn ein Verzeichnis „collect-diagnostics-tmp-ext“ vorhanden ist, entfernen Sie es. Führen Sie dazu den Befehl „rm -r collect-diagnostics-tmp-ext“ aus.
Hinweis: Die erweiterte Datei wird in der Regel verwendet, um Node-Abstürze zu untersuchen. Wenn ein Node-Absturz fortlaufend untersucht wird und der Support nicht alle erforderlichen Protokolle erfasst hat, wenden Sie sich an den Support, bevor Sie das Verzeichnis „collect-diagnostics-tmp-ext“ bereinigen, da dadurch die erforderlichen Core-Dateien gelöscht werden können.