Nodo metro: Come raccogliere i log dal nodo metro
Summary: Questo articolo descrive la procedura per raccogliere i registri dal nodo metro e illustra anche quali registri/dati potrebbero essere necessari per un problema di prestazioni.
Instructions
Procedura per eseguire le seguenti attività:
- Quali log sono necessari per eseguire il debug dei problemi del nodo metro?
- Come acquisire collect-diagnostics su un cluster del nodo metro?
- Come confermare i pacchetti di raccolta della diagnostica esistenti sui server di gestione?
- Come annullare ed eseguire la pulizia di una diagnostica di raccolta in corso in un nodo metro?
Un. Quali log sono necessari per eseguire il debug dei problemi del nodo metro?
-
Il comando necessario per raccogliere i registri dal nodo metro è denominato "collect-diagnostics" e può essere eseguito da qualsiasi nodo (*1) nella configurazione del nodo metro. L'esecuzione di questo comando su un director di un cluster di nodi metro dovrebbe avere tutti i dati di tutti i director, di tutti i nodi di un cluster. NON eseguire questo comando su più di un nodo alla volta.
*1 NOTA: Eseguire il comando "collect-diagnostics" da un solo director, su un solo cluster se si tratta di una configurazione Metro, e attendere il completamento prima di raccogliere i CD da un altro director o dal cluster peer, se necessario. -
Il comando "collect-diagnostics" produce un file di registro tar.gz compresso contenente i file di configurazione e di registro. Il file collect-diagnostics viene posizionato nella directory /diag/collect-diagnostics-out/ sul nodo da cui è stato eseguito. Al completamento del comando utilizzare WINSCP o un'utilità SCP equivalente per copiare il file dal nodo. A questo punto può essere fornito per supportare l'analisi. Sono disponibili ulteriori informazioni sull'utilizzo di questo comando nella sezione B riportata di seguito.
Note:- Se il comando "collect-diagnostics" viene eseguito senza opzioni, vengono generati due file, un file di base e un file esteso. Questa operazione può richiedere molto tempo sui sistemi dimensionati.
- Il supporto del nodo metro richiede in genere solo il file di base, tuttavia, in alcune circostanze, per problemi di prestazioni potrebbe essere richiesto anche il file esteso.
- Le opzioni standard che può essere necessario utilizzare per l'esecuzione di collect-diagnostics sono:
- ".
--noextended": Questa opzione omette la raccolta della diagnostica estesa. - ".
--last-logs": Questa opzione acquisisce i log indietro per un numero x di ore o giorni.
- ".
- Per ulteriori informazioni sul comando, è possibile digitare "collect-diagnostics -h"
Questi sono esempi dell'aspetto di questi due nomi di file. La data e l'ora, mostrate come YYYY-MM-DD-HH.MM.SS, derivano dalla data e dall'ora in cui sono stati raccolti:
- File di base:
<Serial number>-c1-diag-YYYY-MM-DD-HH.MM.SS.tar.gz - File esteso:
<Serial number>-c1-diag-ext-YYYY-MM-DD-HH.MM.SS.tar.gz
-
I problemi di prestazioni sono complessi e richiedono la raccolta di molte informazioni specifiche. Di conseguenza, abbiamo un questionario sulle prestazioni che i clienti devono compilare per accelerare questo processo. Il questionario è allegato a questo articolo della Knowledge Base nella specifica sezione alla fine della pagina.
-
In alcuni tipi di problemi di prestazioni, è utile acquisire un registro aggiuntivo denominato "fe_perf_stats". I registri vengono generati continuamente, ma non acquisiti tramite collect-diagnostics. Per acquisire questo registro, passare a / var/log/VPlex/cli su un nodo di ciascun cluster ed eseguire il comando "tar cvzf fe-perf-stats.tar.gz fe_perf_stats*" per comprimere i dati dei file in un file tar. Connettersi al nodo con WINSCP o un'utilità SCP equivalente e accedere a /var/log/VPlex/cli. Copiare il file "fe-perf-stats.tar.gz" sul sistema. Caricare il file tar insieme a uno o più file collect-diagnostics, se richiesto dal supporto, nella SR o in un link FTP fornito dal supporto nella SR e in un e-mail.
-
Oltre a raccogliere la diagnostica, potrebbe essere utile acquisire le seguenti informazioni:
- Aprire il logging per una sessione PuTTY,
- Quindi eseguire i comandi riportati di seguito,
- Quindi raccogliere il registro PuTTY e scaricarlo sul sistema,
- Allegare quindi il registro PuTTY, la diagnostica di raccolta e tutti gli altri dati richiesti alla SR.
I seguenti comandi devono essere eseguiti dal prompt di VPlexcli.
cluster statusll clusters/**/storage-views/* --fullll ~portsshow-use-hierarchy /clusters/**/virtual-volumes/*ll ~system-volumesls -t /clusters/*/directors/*::serial-number(questo comando elenca tutti i DST per ogni nodo)ls -t /clusters/**/director-*/::hostname(i nomi host visualizzati sono gli indirizzi IP, sono previsti)
B. Come acquisire collect-diagnostics su un cluster del nodo metro?
Per acquisire questi dati, eseguire un comando collect-diagnostics con i seguenti flag: "--noextended" e "--last-logs 30d".
-
Stabilire una sessione SSH su un prompt Linux del nodo director, ad esempio service@director-1-1-a, quindi accedere a vplexcli.
Output di esempio:
login as: service Keyboard-interactive authentication prompts from server: | Password: End of keyboard-interactive prompts from server Last login: <date and timestamp data> from x.x.x.x service@director-1-1-a:~> service@director-1-1-a:~> vplexcli Trying ::1... Connected to localhost. Escape character is '^]'. VPlexcli:/>
-
Per avviare collect-diagnostics, dal prompt di vplexcli eseguire il comando "collect-diagnostics" con le opzioni indicate, come mostrato nell'esempio riportato di seguito.
Esempio di output:
VPlexcli:/> collect-diagnostics --noextended --last-logs 30d ('WARNING:The collect-diagnostics command was issued with option --noextended. ',) The following file(s) will NOT be collected: core files fast trace dump files slow trace dump files udcom trace dump files udcom legacy trace files user-defined performance sink files the management console's heap ('WARNING:Only the logs that are generated in the last 30 days are collected.') 2024-02-09 19:55:12 UTC: ****Initializing collect-diagnostics... 2024-02-09 19:55:13 UTC: No cluster-witness server found. 2024-02-09 19:55:13 UTC: Free space = 88G 2024-02-09 19:55:13 UTC: Total space needed = 1907M ================================================================================ Starting collect-diagnostics, this operation might take a while... ================================================================================ Executing cluster collection ..
C. Come convalidare i pacchetti collect-diagnostics esistenti sul director/nodo.
-
Al termine del comando collect-diagnostics e al prompt vplexcli, connettersi al director da cui è stato eseguito il comando utilizzando winscp [o utilità SCP equivalente] e passare alla cartella /diag/collect-diagnostics-out/
-
Identificare uno o più file di registro con il timestamp corretto e scaricarli sulla workstation locale.
D. Come annullare una collect-diagnostics in corso
-
Se si è ancora nella sessione PuTTY in cui è stato avviato collect-diagnostics, si dovrebbe visualizzare lo streaming dell'output ancora in esecuzione.
Output di esempio:
VPlexcli:/> collect-diagnostics --noextended --last-logs 30d ('WARNING:The collect-diagnostics command was issued with option --noextended. ',) The following file(s) will NOT be collected: core files fast trace dump files slow trace dump files udcom trace dump files udcom legacy trace files user-defined performance sink files the management console's heap ('WARNING:Only the logs that are generated in the last 30 days are collected.') 2022-02-09 19:55:12 UTC: ****Initializing collect-diagnostics... 2022-02-09 19:55:13 UTC: No cluster-witness server found. 2022-02-09 19:55:13 UTC: Free space = 88G 2022-02-09 19:55:13 UTC: Total space needed = 1907M ================================================================================ Starting collect-diagnostics, this operation might take a while... ================================================================================ Executing cluster collection .. -
Aprire una sessione PuTTY duplicata e accedere al Director da cui è stata avviata il processo collect-diagnostics, utilizzando l'account di servizio.
Output di esempio:
login as: service Using keyboard-interactive authentication. Password: Last login: <date and time stamp data> from x.x.x.x service@director-1-1-b:~>
-
Una volta nel director, riavviare la console di gestione utilizzando il seguente comando per annullare collect-diagnostics in esecuzione.
Output di esempio:
service@director-1-1-b:~> sudo systemctl restart VPlexManagementConsole.service
-
Tornando alla prima sessione PuTTY con collect-diagnostics in esecuzione al riavvio della console di gestione, dovrebbe essere visualizzato il report collect-diagnostics riportato come ultimo output annotato:
"Connection closed by foreign host."
Output di esempio (controllare l'ultima riga dell'output):
VPlexcli:/> collect-diagnostics --noextended --last-logs 30d ('WARNING:The collect-diagnostics command was issued with option --noextended. ',) The following file(s) will NOT be collected: core files fast trace dump files slow trace dump files udcom trace dump files udcom legacy trace files user-defined performance sink files the management console's heap ('WARNING:Only the logs that are generated in the last 30 days are collected.') 2022-02-09 20:02:03 UTC: ****Initializing collect-diagnostics... 2022-02-09 20:02:04 UTC: No cluster-witness server found. 2022-02-09 20:02:04 UTC: Free space = 88G 2022-02-09 20:02:04 UTC: Total space needed = 1907M ================================================================================ Starting collect-diagnostics, this operation might take a while... ================================================================================ Executing cluster collection .. ERROR Executing SMS log collection .. Connection closed by foreign host. <<< -
Una volta che collect-diagnostics viene arrestato, passaggio 3 sopra, tornare alla seconda sessione PuTTY e 'cd' alla directory /diag, quindi eseguire 'll ' e dovrebbero vedere alcune directory aggiuntive,
collect-diagnostics-tmpcollect-diagnostics-jobscollect-diagnostics-tmp-ext*
*se non sono stati omessi file estesi
Output di esempio:
service@director-1-1-b:/diag> ll total 32 drwxr-xr-x 2 service groupSvc 4096 Feb 9 20:03 collect-diagnostics-tmp-ext drwxr-xr-x 2 service groupSvc 4096 Feb 9 20:03 collect-diagnostics-jobs drwxr-xr-x 2 service groupSvc 4096 Feb 9 20:04 collect-diagnostics-out drwxr-xr-x 3 service groupSvc 4096 Feb 9 20:02 collect-diagnostics-tmp drwx------ 2 root root 16384 Jan 27 16:54 lost+found drwx--x--x 3 service groupSvc 4096 Dec 17 03:08 share service@director-1-1-b:/diag>
-
Se si esamina l'interno di ciascuna di queste directory, vengono visualizzati i file con la data e l'ora in cui è stato avviato collect-diagnostics, ora annullato. Questi file occupano spazio nella partizione /diag e devono essere rimossi.
-
Per rimuovere/eliminare i file dalla directory /diag, digitare "rm -r collect-diagnostics-jobs" e "rm -r collect-diagnostics-tmp", quindi immettere nuovamente "ll" per assicurarsi che le directory siano state eliminate o rimosse.
Output di esempio:
service@director-1-1-b:/diag> rm -r collect-diagnostics-jobs service@director-1-1-b:/diag> rm -r collect-diagnostics-tmp service@director-1-1-b:/diag> ll total 24 drwxr-xr-x 2 service groupSvc 4096 Feb 9 20:04 collect-diagnostics-out drwx------ 2 root root 16384 Jan 27 16:54 lost+found drwx--x--x 3 service groupSvc 4096 Dec 17 03:08 share service@director-1-1-b:/diag>
-
Se esiste una directory "collect-diagnostics-tmp-ext", rimuoverla eseguendo "rm -r collect-diagnostics-tmp-ext"
Nota: il file esteso viene in genere utilizzato per analizzare gli arresti anomali dei nodi. Se è in corso un'indagine su un arresto anomalo del nodo e il supporto non ha acquisito tutti i registri necessari, verificare con il supporto prima di pulire la directory collect-diagnostics-tmp-ext, in quanto questa operazione potrebbe eliminare i file di base necessari.