Metro-node: Sådan indsamles logfiler fra metronoden
Summary: Denne artikel beskriver trinnene til, hvordan du indsamler logfiler fra metronoden, og dækker også, hvilke logfiler/data der kan være nødvendige for et ydelsesproblem.
Instructions
Trin til, hvordan du udfører følgende opgaver:
- Hvilke logfiler kræves for at fejlfinde metronodeproblemer?
- Hvordan registrerer jeg indsamlingsdiagnosticering på en metronodeklynge?
- Sådan valideres de eksisterende collect-diagnostics-pakker på administrationsserverne.
- Hvordan annullerer og rydder man op i en igangværende indsamlingsdiagnostik i en metronode?
En. Hvilke logfiler kræves for at fejlfinde metronodeproblemer?
-
Den kommando, der kræves for at indsamle logfiler fra metronoden, kaldes "collect-diagnostics" og kan køres fra enhver node (*1) i metronodeopsætningen. Kørsel af denne kommando på en direktør for en metronodeklynge skal have alle data fra alle direktører, fra alle noder i en klynge. Kør IKKE denne kommando på mere end én node ad gangen.
*1 BEMÆRK: Kør kommandoen "collect-diagnostics" fra kun én Director, på kun én klynge, hvis det er en Metro-konfiguration, og vent på, at den er helt færdig, før du samler cd'erne fra en anden director eller fra peer-klyngen, hvis det er nødvendigt. -
Kommandoen 'collect-diagnostics' producerer en komprimeret tar.gz-logfil, der indeholder konfigurations- og logfiler. Filen collect-diagnostics placeres i mappen /diag/collect-diagnostics-out/ på den node, den blev kørt fra. Når kommandoen er færdig, skal du bruge WINSCP eller et tilsvarende SCP-værktøj til at kopiere filen fra noden, og derefter kan den leveres til understøttelse af analyse. Der er flere oplysninger om brugen af denne kommando i afsnit B nedenfor.
Bemærk:- Hvis kommandoen 'collect-diagnostics' køres uden indstillinger, genereres to filer, en basisfil og en udvidet fil. Dette kan tage lang tid på skalerede systemer.
- Understøttelse af Metro-noder kræver generelt kun basisfilen, men i nogle tilfælde kan de også bede om problemer med ydeevnen.
- Standardindstillinger, der kan blive bedt om at blive brugt, når der køres indsamlingsdiagnostik, er,
- "
--noextended": Denne indstilling udelader indsamlingen af udvidet diagnosticering. - "
--last-logs": Denne indstilling registrerer logfiler tilbage x antal timer eller dage.
- "
- Du kan få flere oplysninger om kommandoen ved at skrive "collect-diagnostics -h"
Dette er eksempler på, hvordan disse to filnavne ser ud, dato og klokkeslæt, vist som YYYY-MM-DD-HH.MM.SS, er fra den dato og det klokkeslæt, hvor disse blev indsamlet:
- Basisfil:
<Serial number>-c1-diag-YYYY-MM-DD-HH.MM.SS.tar.gz - Udvidet fil:
<Serial number>-c1-diag-ext-YYYY-MM-DD-HH.MM.SS.tar.gz
-
Problemer med ydeevnen er komplekse og kræver, at der indsamles mange specifikke oplysninger. Som følge heraf har vi et præstationsspørgeskema, som kunderne bliver bedt om at udfylde for at fremskynde denne proces. Spørgeskemaet findes vedhæftet denne Knowledge Base-artikel i afsnittet om vedhæftede filer til sidst.
-
I nogle typer problemer med ydeevnen er det nyttigt at registrere en ekstra logfil kaldet "fe_perf_stats". Logfilerne genereres løbende, men registreres ikke af indsamlingsdiagnosticering. For at registrere denne logfil skal du cd (skift mappe) til /var/log/VPlex/cli på en node fra hver klynge og køre kommandoen "tar cvzf fe-perf-stats.tar.gz fe_perf_stats*" for at komprimere filernes data til en tar-fil. Opret forbindelse til noden med WINSCP, eller et tilsvarende SCP-hjælpeprogram, og gå til /var/log/VPlex/cli. Kopiér filen "fe-perf-stats.tar.gz" til systemet. Upload tar-filen sammen med en eller flere indsamlingsdiagnosticeringsfiler, hvis supporten anmoder om det, til SR'en eller en ftp-linksupport, der giver dig i SR'en og en e-mail.
-
Ud over at indsamle diagnostik kan det være nyttigt at registrere følgende oplysninger;
- Åbn logning til en kittsession,
- Kør derefter kommandoerne nedenfor,
- Saml derefter Putty-loggen og download den til dit system,
- Vedhæft derefter PuTTY-loggen, indsamlingsdiagnosticeringen og eventuelle andre data, der anmodes om, til SR'en.
Følgende kommandoer skal køres fra VPlexcli-prompten.
cluster statusll clusters/**/storage-views/* --fullll ~portsshow-use-hierarchy /clusters/**/virtual-volumes/*ll ~system-volumesls -t /clusters/*/directors/*::serial-number(denne kommando viser alle DST'er for hver node)ls -t /clusters/**/director-*/::hostname(de viste værtsnavne er IP-adresserne, dette forventes)
B. Hvordan registrerer jeg indsamlingsdiagnosticering på en metronodeklynge?
For at registrere disse data skal du køre en indsamlingsdiagnosticeringskommando med følgende flag "--noextended" og "--last-logs 30d."
-
Opret en SSH-session ved en Director-node Linux-prompt, eksempel, service@director-1-1-a, og log derefter ind på vplexcli.
Eksempel på output:
login as: service Keyboard-interactive authentication prompts from server: | Password: End of keyboard-interactive prompts from server Last login: <date and timestamp data> from x.x.x.x service@director-1-1-a:~> service@director-1-1-a:~> vplexcli Trying ::1... Connected to localhost. Escape character is '^]'. VPlexcli:/>
-
For at starte indsamlingsdiagnosticeringen skal du fra vplexcli-prompten køre kommandoen "collect-diagnostics" med de rettede indstillinger som vist i eksemplet nedenfor.
Eksempel på output:
VPlexcli:/> collect-diagnostics --noextended --last-logs 30d ('WARNING:The collect-diagnostics command was issued with option --noextended. ',) The following file(s) will NOT be collected: core files fast trace dump files slow trace dump files udcom trace dump files udcom legacy trace files user-defined performance sink files the management console's heap ('WARNING:Only the logs that are generated in the last 30 days are collected.') 2024-02-09 19:55:12 UTC: ****Initializing collect-diagnostics... 2024-02-09 19:55:13 UTC: No cluster-witness server found. 2024-02-09 19:55:13 UTC: Free space = 88G 2024-02-09 19:55:13 UTC: Total space needed = 1907M ================================================================================ Starting collect-diagnostics, this operation might take a while... ================================================================================ Executing cluster collection ..
C. Hvordan man validerer de eksisterende indsamlingsdiagnosticeringspakker på direktøren/noden.
-
Når kommandoen collect-diagnostics afsluttes og vender tilbage til vplexcli-prompten, skal du oprette forbindelse til den director, du kørte kommandoen fra, ved hjælp af winscp [eller tilsvarende SCP-hjælpeprogram] og gå til mappen /diag/collect-diagnostics-out/
-
Identificer en eller flere logfiler med det korrekte tidsstempel, og download dem til din lokale arbejdsstation.
D. Sådan annullerer du en igangværende afhentningsdiagnosticering
-
Hvis du stadig er på PuTTY-sessionen, hvor du startede indsamlingsdiagnosticeringen, bør du se outputstreamingen til indsamlingsdiagnostik, der viser, at den stadig kører.
Eksempel på output:
VPlexcli:/> collect-diagnostics --noextended --last-logs 30d ('WARNING:The collect-diagnostics command was issued with option --noextended. ',) The following file(s) will NOT be collected: core files fast trace dump files slow trace dump files udcom trace dump files udcom legacy trace files user-defined performance sink files the management console's heap ('WARNING:Only the logs that are generated in the last 30 days are collected.') 2022-02-09 19:55:12 UTC: ****Initializing collect-diagnostics... 2022-02-09 19:55:13 UTC: No cluster-witness server found. 2022-02-09 19:55:13 UTC: Free space = 88G 2022-02-09 19:55:13 UTC: Total space needed = 1907M ================================================================================ Starting collect-diagnostics, this operation might take a while... ================================================================================ Executing cluster collection .. -
Åbn en dubleret PuTTY-session, og log på direktøren, hvor du startede indsamlingsdiagnosticeringen, ved hjælp af tjenestekontoen.
Eksempel på output:
login as: service Using keyboard-interactive authentication. Password: Last login: <date and time stamp data> from x.x.x.x service@director-1-1-b:~>
-
Når du er på Director, skal du genstarte administrationskonsollen ved hjælp af følgende kommando for at annullere den Collect-Diagnostics, der kører.
Eksempel på output:
service@director-1-1-b:~> sudo systemctl restart VPlexManagementConsole.service
-
Når du ser tilbage på den første PuTTY-session, hvor indsamlingsdiagnosticeringen kører, bør du, da du genstartede administrationskonsollen, se rapporten for indsamling af diagnosticering som det sidst noterede output:
"Connection closed by foreign host."
Prøveoutput (kontroller den sidste linje i outputtet):
VPlexcli:/> collect-diagnostics --noextended --last-logs 30d ('WARNING:The collect-diagnostics command was issued with option --noextended. ',) The following file(s) will NOT be collected: core files fast trace dump files slow trace dump files udcom trace dump files udcom legacy trace files user-defined performance sink files the management console's heap ('WARNING:Only the logs that are generated in the last 30 days are collected.') 2022-02-09 20:02:03 UTC: ****Initializing collect-diagnostics... 2022-02-09 20:02:04 UTC: No cluster-witness server found. 2022-02-09 20:02:04 UTC: Free space = 88G 2022-02-09 20:02:04 UTC: Total space needed = 1907M ================================================================================ Starting collect-diagnostics, this operation might take a while... ================================================================================ Executing cluster collection .. ERROR Executing SMS log collection .. Connection closed by foreign host. <<< -
Når indsamlingsdiagnostikken er set stoppet, trin 3 ovenfor, skal du gå tilbage til den anden PuTTY-session og 'cd' til / diag-biblioteket, derefter køre 'll ', og du bør se nogle ekstra mapper,
collect-diagnostics-tmpcollect-diagnostics-jobscollect-diagnostics-tmp-ext*
*Hvis udvidede filer ikke blev udeladt
Eksempel på output:
service@director-1-1-b:/diag> ll total 32 drwxr-xr-x 2 service groupSvc 4096 Feb 9 20:03 collect-diagnostics-tmp-ext drwxr-xr-x 2 service groupSvc 4096 Feb 9 20:03 collect-diagnostics-jobs drwxr-xr-x 2 service groupSvc 4096 Feb 9 20:04 collect-diagnostics-out drwxr-xr-x 3 service groupSvc 4096 Feb 9 20:02 collect-diagnostics-tmp drwx------ 2 root root 16384 Jan 27 16:54 lost+found drwx--x--x 3 service groupSvc 4096 Dec 17 03:08 share service@director-1-1-b:/diag>
-
Hvis du kigger i hver af disse mapper, kan du se filer med den dato og det klokkeslæt, hvor du startede den nu annullerede indsamlingsdiagnosticering. Disse filer optager plads i partitionen /diag og bør fjernes.
-
Hvis du vil fjerne/slette filerne fra mappen /diag, skal du skrive "rm -r collect-diagnostics-jobs" og "rm -r collect-diagnostics-tmp" og derefter indtaste "ll" igen for at sikre, at mapperne er blevet slettet eller fjernet.
Eksempel på output:
service@director-1-1-b:/diag> rm -r collect-diagnostics-jobs service@director-1-1-b:/diag> rm -r collect-diagnostics-tmp service@director-1-1-b:/diag> ll total 24 drwxr-xr-x 2 service groupSvc 4096 Feb 9 20:04 collect-diagnostics-out drwx------ 2 root root 16384 Jan 27 16:54 lost+found drwx--x--x 3 service groupSvc 4096 Dec 17 03:08 share service@director-1-1-b:/diag>
-
Hvis der findes mappen "collect-diagnostics-tmp-ext", skal du fjerne den ved at køre "rm -r collect-diagnostics-tmp-ext"
Bemærk: Den udvidede fil bruges typisk til at undersøge nodenedbrud. Hvis der er en igangværende undersøgelse af et nodenedbrud, og support ikke har registreret alle nødvendige logfiler, skal du kontakte supporten, før du rydder op i collect-diagnostics-tmp-ext-mappen, da dette kan slette nødvendige kernefiler.