Metro-node: Hvordan samle logger fra metronoden
Summary: Denne artikkelen beskriver fremgangsmåten for å samle inn logger fra metro-noden, og dekker også hvilke logger/data som kan være nødvendige for et ytelsesproblem.
Instructions
Trinn for hvordan du utfører følgende oppgaver:
- Hvilke logger kreves for å feilsøke problemer med metronoden?
- Hvordan registrerer jeg innsamlingsdiagnostikk på en metronodeklynge?
- Validere eksisterende collect-diagnostics-pakker på administrasjonsserverne.
- Hvordan avbryte og rydde opp i en pågående innsamlingsdiagnostikk i en metronode?
En. Hvilke logger kreves for å feilsøke problemer med metronoden?
-
Kommandoen som kreves for å samle inn logger fra metronoden, kalles "collect-diagnostics" og kan kjøres fra en hvilken som helst node (*1) i oppsettet for metronoden. Hvis du kjører denne kommandoen på én direktør i en metronodeklynge, bør alle dataene fra alle direktørene ha fra alle nodene i en klynge. IKKE kjør denne kommandoen på mer enn én node om gangen.
*1 MERK: Kjør kommandoen "collect-diagnostics" fra bare én direktør, på bare én klynge hvis en Metro-konfigurasjon, og vent til den er fullført før du samler CD-ene fra en annen direktør eller fra peer-klyngen, om nødvendig. -
Kommandoen 'collect-diagnostics' produserer en komprimert tar.gz loggfil som inneholder konfigurasjons- og loggfiler. Collect-diagnostics-filen plasseres i /diag/collect-diagnostics-out/-mappen på noden den ble kjørt fra. Når kommandoen er fullført, bruker du WINSCP, eller et tilsvarende SCP-verktøy, til å kopiere filen fra noden, og deretter kan den leveres til støtte for analyse. Du finner mer informasjon om bruken av denne kommandoen i del B nedenfor.
Merknader:- Hvis kommandoen 'collect-diagnostics' kjøres uten alternativer, genereres to filer, en basisfil og en utvidet fil. Dette kan ta ganske lang tid på skalerte systemer.
- Støtte for metronode krever vanligvis bare Base-filen, men i noen tilfeller ytelsesproblemer kan de også be om den utvidede filen.
- Standardalternativer som kan bli bedt om å bli brukt når du kjører innsamlingsdiagnostikk, er:
- »
--noextended": Dette alternativet utelater innsamling av utvidet diagnostikk. - »
--last-logs": Dette alternativet fanger logger tilbake x antall timer eller dager.
- »
- For mer informasjon om kommandoen, kan du skrive "collect-diagnostics -h"
Dette er eksempler på hvordan disse to filnavnene ser ut, datoen og klokkeslettet, vist som YYYY-MM-DD-HH.MM.SS, er fra datoen og klokkeslettet disse ble samlet inn:
- Base fil:
<Serial number>-c1-diag-YYYY-MM-DD-HH.MM.SS.tar.gz - Utvidet fil:
<Serial number>-c1-diag-ext-YYYY-MM-DD-HH.MM.SS.tar.gz
-
Ytelsesproblemer er komplekse og krever mye spesifikk informasjon som skal samles. Som et resultat har vi et ytelsesspørreskjema som kundene blir bedt om å fylle ut for å fremskynde denne prosessen. Spørreskjemaet finner du vedlagt denne kunnskapsbaseartikkelen i vedleggsdelen til slutt.
-
I noen typer ytelsesproblemer er det nyttig å registrere en ekstra logg kalt "fe_perf_stats". Loggene genereres kontinuerlig, men fanges ikke opp av collect-diagnostics. For å registrere denne loggen, cd (endre katalog) til /var/log/VPlex/cli på en node fra hver klynge og kjør kommandoen "tar cvzf fe-perf-stats.tar.gz fe_perf_stats*" for å komprimere dataene til filene til en tar-fil. Koble til noden med WINSCP eller et tilsvarende SCP-verktøy, og bla til /var/log/VPlex/cli. Kopier "fe-perf-stats.tar.gz"-filen til systemet ditt. Last opp tar-filen sammen med én eller flere filer for innsamlingsdiagnostikk til SR hvis du ber om det, til SR eller en ftp-kobling som støtte gir deg i SR og en e-post.
-
I tillegg til å samle inn diagnostikk kan det være nyttig å fange opp følgende informasjon;
- Åpen logging for en kittøkt,
- Kjør deretter kommandoene nedenfor,
- Samle deretter Putty-loggen og last den ned til systemet ditt,
- Legg deretter ved PuTTY-loggen, innsamlingsdiagnostikken og eventuelle andre forespurte data til SR.
Følgende kommandoer skal kjøres fra VPlexcli-ledeteksten.
cluster statusll clusters/**/storage-views/* --fullll ~portsshow-use-hierarchy /clusters/**/virtual-volumes/*ll ~system-volumesls -t /clusters/*/directors/*::serial-number(denne kommandoen lister opp alle DST-er for hver node)ls -t /clusters/**/director-*/::hostname(vertsnavnene som vises er IP-adressene, dette er forventet)
B. Hvordan registrerer jeg innsamlingsdiagnostikk på en metronodeklynge?
Hvis du vil registrere disse dataene, kjører du en kommando for innsamlingsdiagnostikk med følgende flagg "--noextended" og "--last-logs 30d."
-
Opprett en SSH-økt ved en director node Linux-ledetekst, eksempel, service@director-1-1-a, og logg deretter på vplexcli.
Eksempel på utdata:
login as: service Keyboard-interactive authentication prompts from server: | Password: End of keyboard-interactive prompts from server Last login: <date and timestamp data> from x.x.x.x service@director-1-1-a:~> service@director-1-1-a:~> vplexcli Trying ::1... Connected to localhost. Escape character is '^]'. VPlexcli:/>
-
For å starte innsamlingsdiagnostikken kjører du kommandoen "collect-diagnostics" fra vplexcli-ledeteksten med de rettede alternativene som vist i eksemplet nedenfor.
Eksempel på utdata:
VPlexcli:/> collect-diagnostics --noextended --last-logs 30d ('WARNING:The collect-diagnostics command was issued with option --noextended. ',) The following file(s) will NOT be collected: core files fast trace dump files slow trace dump files udcom trace dump files udcom legacy trace files user-defined performance sink files the management console's heap ('WARNING:Only the logs that are generated in the last 30 days are collected.') 2024-02-09 19:55:12 UTC: ****Initializing collect-diagnostics... 2024-02-09 19:55:13 UTC: No cluster-witness server found. 2024-02-09 19:55:13 UTC: Free space = 88G 2024-02-09 19:55:13 UTC: Total space needed = 1907M ================================================================================ Starting collect-diagnostics, this operation might take a while... ================================================================================ Executing cluster collection ..
C. Hvordan validere eksisterende samlediagnostikkpakker på direktøren/noden.
-
Når kommandoen collect-diagnostics er fullført og går tilbake til vplexcli-ledeteksten, kobler du til direktøren du kjørte kommandoen fra ved hjelp av winscp [eller tilsvarende SCP-verktøy] og blar til mappen /diag/collect-diagnostics-out/
-
Identifiser én eller flere loggfiler med riktig tidsstempel og last dem ned til din lokale arbeidsstasjon.
D. Hvordan avbryte en pågående innsamlingsdiagnostikk
-
Hvis du fortsatt er på PuTTY-økten der du startet innsamlingsdiagnostikken, skal du se strømmingen av samlediagnostikkutgangen som viser at den fortsatt kjører.
Eksempel på utdata:
VPlexcli:/> collect-diagnostics --noextended --last-logs 30d ('WARNING:The collect-diagnostics command was issued with option --noextended. ',) The following file(s) will NOT be collected: core files fast trace dump files slow trace dump files udcom trace dump files udcom legacy trace files user-defined performance sink files the management console's heap ('WARNING:Only the logs that are generated in the last 30 days are collected.') 2022-02-09 19:55:12 UTC: ****Initializing collect-diagnostics... 2022-02-09 19:55:13 UTC: No cluster-witness server found. 2022-02-09 19:55:13 UTC: Free space = 88G 2022-02-09 19:55:13 UTC: Total space needed = 1907M ================================================================================ Starting collect-diagnostics, this operation might take a while... ================================================================================ Executing cluster collection .. -
Åpne en duplisert PuTTY-økt og logg inn på direktøren der du startet innsamlingsdiagnostikken ved hjelp av tjenestekontoen.
Eksempel på utdata:
login as: service Using keyboard-interactive authentication. Password: Last login: <date and time stamp data> from x.x.x.x service@director-1-1-b:~>
-
Når du er på regissøren, starter du administrasjonskonsollen på nytt ved hjelp av følgende kommando for å avbryte innsamlingsdiagnostikken som kjører.
Eksempel på utdata:
service@director-1-1-b:~> sudo systemctl restart VPlexManagementConsole.service
-
Når du ser tilbake på den første PuTTY-økten der samlediagnostikken kjørte da du startet administrasjonskonsollen på nytt, skal du se innsamlingsdiagnostikkrapporten følgende som den sist noterte utdataen.
"Connection closed by foreign host."
Prøveutgang (sjekk den siste linjen i utdataene):
VPlexcli:/> collect-diagnostics --noextended --last-logs 30d ('WARNING:The collect-diagnostics command was issued with option --noextended. ',) The following file(s) will NOT be collected: core files fast trace dump files slow trace dump files udcom trace dump files udcom legacy trace files user-defined performance sink files the management console's heap ('WARNING:Only the logs that are generated in the last 30 days are collected.') 2022-02-09 20:02:03 UTC: ****Initializing collect-diagnostics... 2022-02-09 20:02:04 UTC: No cluster-witness server found. 2022-02-09 20:02:04 UTC: Free space = 88G 2022-02-09 20:02:04 UTC: Total space needed = 1907M ================================================================================ Starting collect-diagnostics, this operation might take a while... ================================================================================ Executing cluster collection .. ERROR Executing SMS log collection .. Connection closed by foreign host. <<< -
Når collect-diagnostikk er sett stoppet, trinn 3 ovenfor, gå tilbake til den andre PuTTY økten og "cd" til / diag katalogen, deretter kjøre 'll' og du bør se noen ekstra kataloger,
collect-diagnostics-tmpcollect-diagnostics-jobscollect-diagnostics-tmp-ext*
*Hvis utvidede filer ikke ble utelatt
Eksempel på utdata:
service@director-1-1-b:/diag> ll total 32 drwxr-xr-x 2 service groupSvc 4096 Feb 9 20:03 collect-diagnostics-tmp-ext drwxr-xr-x 2 service groupSvc 4096 Feb 9 20:03 collect-diagnostics-jobs drwxr-xr-x 2 service groupSvc 4096 Feb 9 20:04 collect-diagnostics-out drwxr-xr-x 3 service groupSvc 4096 Feb 9 20:02 collect-diagnostics-tmp drwx------ 2 root root 16384 Jan 27 16:54 lost+found drwx--x--x 3 service groupSvc 4096 Dec 17 03:08 share service@director-1-1-b:/diag>
-
Hvis du sjekker i hver av disse katalogene, ser du filer med datoen og klokkeslettet for å starte den nå avbrutte innsamlingsdiagnostikken. Disse filene tar opp plass i /diag-partisjonen og bør fjernes.
-
Hvis du vil fjerne/slette filene fra /diag-katalogen, skriver du inn "rm -r collect-diagnostics-jobs" og "rm -r collect-diagnostics-tmp", og deretter skriver du inn "ll" igjen for å sikre at katalogene er slettet eller fjernet.
Eksempel på utdata:
service@director-1-1-b:/diag> rm -r collect-diagnostics-jobs service@director-1-1-b:/diag> rm -r collect-diagnostics-tmp service@director-1-1-b:/diag> ll total 24 drwxr-xr-x 2 service groupSvc 4096 Feb 9 20:04 collect-diagnostics-out drwx------ 2 root root 16384 Jan 27 16:54 lost+found drwx--x--x 3 service groupSvc 4096 Dec 17 03:08 share service@director-1-1-b:/diag>
-
Hvis det finnes en «collect-diagnostics-tmp-ext»-katalog, fjerner du den og kjører «rm -r collect-diagnostics-tmp-ext»
Merk: Den utvidede filen brukes vanligvis til å undersøke nodekrasj. Hvis det pågår en etterforskning av en nodekrasj og støtten ikke har fanget opp alle nødvendige logger, må du kontakte kundestøtte før du rydder opp i collect-diagnostics-tmp-ext-katalogen, da dette kan slette nødvendige kjernefiler.