Metro node : Comment collecter les journaux à partir de Metro Node
Summary: Cet article décrit les étapes de collecte des fichiers log à partir de Metro Node et décrit également les journaux/données qui peuvent être nécessaires en cas de problème de performances. ...
Instructions
Étapes pour effectuer les tâches suivantes :
- Quels journaux sont nécessaires pour déboguer les problèmes de Metro Node ?
- Comment capturer collect-diagnostics sur un cluster Metro Node ?
- Comment valider les packages collect-diagnostics existants sur les serveurs de gestion ?
- Comment annuler et nettoyer un collect-diagnostics en cours dans Metro Node ?
Un. Quels journaux sont nécessaires pour déboguer les problèmes de Metro Node ?
-
La commande requise pour collecter les logs à partir de Metro Node s’appelle « collect-diagnostics » et peut être exécutée à partir de n’importe quel nœud (*1) dans la configuration Metro Node. L’exécution de cette commande sur un directeur d’un cluster Metro Node doit disposer de toutes les données de tous les directeurs de tous les nœuds d’un cluster. N’exécutez PAS cette commande sur plusieurs nœuds à la fois.
*1 REMARQUE : Exécutez la commande « collect-diagnostics » à partir d’un seul directeur, sur un seul cluster si une configuration Metro, et attendez qu’elle se termine complètement avant de rassembler les CD d’un autre directeur ou du cluster homologue, si nécessaire. -
La commande « collect-diagnostics » génère un fichier journal tar.gz compressé contenant les fichiers de configuration et les fichiers journaux. Le fichier collect-diagnostics est placé dans le répertoire /diag/collect-diagnostics-out/ sur le nœud depuis lequel il a été exécuté. Une fois la commande terminée, utilisez WINSCP ou un utilitaire SCP équivalent pour copier le fichier hors du nœud. Il peut ensuite être fourni pour la prise en charge de l’analyse. Plus d’informations sur l’utilisation de cette commande sont disponibles dans la section B ci-dessous.
Remarques :- si la commande « collect-diagnostics » est exécutée sans option, deux fichiers sont générés : un fichier de base et un fichier étendu. Cela peut prendre beaucoup de temps sur les systèmes évolutifs.
- La prise en charge de Metro node ne nécessite généralement que le fichier de base, mais dans certaines circonstances, pour des problèmes de performances, ils peuvent également demander le fichier étendu.
- Options standard qu’il faut parfois utiliser lors de l’exécution de collect-diagnostics :
- »
--noextended": Cette option omet la collecte des diagnostics étendus. - »
--last-logs": Cette option capture les journaux x nombre d’heures ou de jours.
- »
- Pour plus de détails sur la commande, vous pouvez saisir « collect-diagnostics -h »
Voici des exemples de ces deux noms de fichiers. La date et l’heure, indiquées par YYYY-MM-DD-HH.MM.SS, correspondent à la date et à l’heure auxquelles ces noms ont été collectés :
- Fichier de base :
<Serial number>-c1-diag-YYYY-MM-DD-HH.MM.SS.tar.gz - Fichier étendu :
<Serial number>-c1-diag-ext-YYYY-MM-DD-HH.MM.SS.tar.gz
-
Les problèmes de performances sont complexes et nécessitent la collecte de nombreuses informations spécifiques. C’est pourquoi nous proposons un questionnaire de performances que les clients sont invités à remplir pour accélérer ce processus. Vous trouverez ce questionnaire dans la section Pièces jointes à la fin de cet article de la base de connaissances.
-
Dans certains types de problèmes de performances, il est utile de capturer un journal supplémentaire appelé « fe_perf_stats ». Les journaux sont générés en continu, mais ne sont pas capturés par la commande collect-diagnostics. Pour capturer ce journal, utilisez cd (changer de répertoire) sur /var/log/VPlex/cli sur un nœud de chaque cluster et exécutez la commande « tar cvzf fe-perf-stats.tar.gz fe_perf_stats* » pour compresser les données des fichiers dans un fichier tar. Connectez-vous au nœud avec WINSCP ou un utilitaire SCP équivalent, puis accédez à /var/log/VPlex/cli. Copiez le fichier « fe-perf-stats.tar.gz » sur votre système. Téléchargez le fichier tar ainsi qu’un ou plusieurs fichiers collect-diagnostics, si vous y êtes invité par le support, sur la demande de service ou sur un lien FTP que le support vous fournit dans la demande de service, ainsi qu’un e-mail.
-
En plus de collecter les diagnostics, il peut être utile de capturer les informations suivantes :
- Open logging pour une session putty,
- Exécutez ensuite les commandes ci-dessous,
- Ensuite, collectez le journal Putty et téléchargez-le sur votre système,
- Ensuite, joignez le journal PuTTY, collect-diagnostics et toutes les autres données demandées à la demande de service.
Les commandes suivantes doivent être exécutées à partir de l’invite VPlexcli.
cluster statusll clusters/**/storage-views/* --fullll ~portsshow-use-hierarchy /clusters/**/virtual-volumes/*ll ~system-volumesls -t /clusters/*/directors/*::serial-number(cette commande répertorie tous les DST pour chaque nœud)ls -t /clusters/**/director-*/::hostname(les noms d’hôte affichés correspondent aux adresses IP, ce qui est normal)
B. Comment capturer collect-diagnostics sur un cluster Metro Node ?
Pour capturer ces données, exécutez une commande collect-diagnostics avec les balises suivantes : « --noextended » et « --last-logs 30d ».
-
Établissez une session SSH à l’invite Linux d’un nœud directeur, par exemple, service@director-1-1-a, puis connectez-vous à vplexcli.
Exemple de résultat :
login as: service Keyboard-interactive authentication prompts from server: | Password: End of keyboard-interactive prompts from server Last login: <date and timestamp data> from x.x.x.x service@director-1-1-a:~> service@director-1-1-a:~> vplexcli Trying ::1... Connected to localhost. Escape character is '^]'. VPlexcli:/>
-
Pour lancer la collecte des diagnostics, depuis la fenêtre de commande vplexcli, exécutez la commande « collect-diagnostics » avec les options de direction comme indiqué dans l’exemple ci-dessous.
Exemple de résultat :
VPlexcli:/> collect-diagnostics --noextended --last-logs 30d ('WARNING:The collect-diagnostics command was issued with option --noextended. ',) The following file(s) will NOT be collected: core files fast trace dump files slow trace dump files udcom trace dump files udcom legacy trace files user-defined performance sink files the management console's heap ('WARNING:Only the logs that are generated in the last 30 days are collected.') 2024-02-09 19:55:12 UTC: ****Initializing collect-diagnostics... 2024-02-09 19:55:13 UTC: No cluster-witness server found. 2024-02-09 19:55:13 UTC: Free space = 88G 2024-02-09 19:55:13 UTC: Total space needed = 1907M ================================================================================ Starting collect-diagnostics, this operation might take a while... ================================================================================ Executing cluster collection ..
C. Comment valider les packages collect-diagnostics existants sur le directeur/nœud.
-
Lorsque la commande collect-diagnostics se termine et revient à l’invite vplexcli, connectez-vous au directeur à partir duquel vous avez exécuté la commande à l’aide de winscp [ou de l’utilitaire SCP équivalent] et accédez au dossier /diag/collect-diagnostics-out/
-
Identifiez un ou plusieurs fichiers journaux avec l’horodatage correct et téléchargez-les sur votre station de travail locale.
D. Comment annuler un collect-diagnostics en cours
-
Si vous êtes toujours dans la session PuTTY où vous avez démarré collect-diagnostics, vous devriez voir le flux de sortie collect-diagnostics en cours d’exécution.
Exemple de sortie :
VPlexcli:/> collect-diagnostics --noextended --last-logs 30d ('WARNING:The collect-diagnostics command was issued with option --noextended. ',) The following file(s) will NOT be collected: core files fast trace dump files slow trace dump files udcom trace dump files udcom legacy trace files user-defined performance sink files the management console's heap ('WARNING:Only the logs that are generated in the last 30 days are collected.') 2022-02-09 19:55:12 UTC: ****Initializing collect-diagnostics... 2022-02-09 19:55:13 UTC: No cluster-witness server found. 2022-02-09 19:55:13 UTC: Free space = 88G 2022-02-09 19:55:13 UTC: Total space needed = 1907M ================================================================================ Starting collect-diagnostics, this operation might take a while... ================================================================================ Executing cluster collection .. -
Ouvrez une session PuTTY en double et connectez-vous au directeur sur lequel vous avez lancé la commande collect-diagnostics à l’aide du compte de service.
Exemple de sortie :
login as: service Using keyboard-interactive authentication. Password: Last login: <date and time stamp data> from x.x.x.x service@director-1-1-b:~>
-
Une fois sur le directeur, redémarrez la console de gestion à l’aide de la commande suivante pour annuler le collect-diagnostics en cours d’exécution.
Exemple de sortie :
service@director-1-1-b:~> sudo systemctl restart VPlexManagementConsole.service
-
Lors du redémarrage de la console de gestion, vous devriez consulter le rapport collect-diagnostics suivant comme dernière sortie notée :
"Connection closed by foreign host."
Exemple de sortie (vérifiez la dernière ligne de la sortie) :
VPlexcli:/> collect-diagnostics --noextended --last-logs 30d ('WARNING:The collect-diagnostics command was issued with option --noextended. ',) The following file(s) will NOT be collected: core files fast trace dump files slow trace dump files udcom trace dump files udcom legacy trace files user-defined performance sink files the management console's heap ('WARNING:Only the logs that are generated in the last 30 days are collected.') 2022-02-09 20:02:03 UTC: ****Initializing collect-diagnostics... 2022-02-09 20:02:04 UTC: No cluster-witness server found. 2022-02-09 20:02:04 UTC: Free space = 88G 2022-02-09 20:02:04 UTC: Total space needed = 1907M ================================================================================ Starting collect-diagnostics, this operation might take a while... ================================================================================ Executing cluster collection .. ERROR Executing SMS log collection .. Connection closed by foreign host. <<< -
Une fois que collect-diagnostics est arrêté, étape 3 ci-dessus, revenez à la deuxième session PuTTY et 'cd' dans le répertoire /diag, puis exécutez 'will' et vous devriez voir des répertoires supplémentaires,
collect-diagnostics-tmpcollect-diagnostics-jobscollect-diagnostics-tmp-ext*
*si les fichiers étendus n’ont pas été omis
Exemple de résultat :
service@director-1-1-b:/diag> ll total 32 drwxr-xr-x 2 service groupSvc 4096 Feb 9 20:03 collect-diagnostics-tmp-ext drwxr-xr-x 2 service groupSvc 4096 Feb 9 20:03 collect-diagnostics-jobs drwxr-xr-x 2 service groupSvc 4096 Feb 9 20:04 collect-diagnostics-out drwxr-xr-x 3 service groupSvc 4096 Feb 9 20:02 collect-diagnostics-tmp drwx------ 2 root root 16384 Jan 27 16:54 lost+found drwx--x--x 3 service groupSvc 4096 Dec 17 03:08 share service@director-1-1-b:/diag>
-
Si vous regardez à l’intérieur de chacun de ces répertoires, vous voyez des fichiers avec la date et l’heure où vous avez démarré la collecte de diagnostics maintenant annulée. Ces fichiers occupent de l’espace dans la partition /diag et doivent être supprimés.
-
Pour retirer/supprimer les fichiers du répertoire /diag, saisissez « rm -r collect-diagnostics-jobs » et « rm -r collect-diagnostics-tmp », puis saisissez à nouveau « ll » pour vous assurer que les répertoires ont été supprimés ou supprimés.
Exemple de résultat :
service@director-1-1-b:/diag> rm -r collect-diagnostics-jobs service@director-1-1-b:/diag> rm -r collect-diagnostics-tmp service@director-1-1-b:/diag> ll total 24 drwxr-xr-x 2 service groupSvc 4096 Feb 9 20:04 collect-diagnostics-out drwx------ 2 root root 16384 Jan 27 16:54 lost+found drwx--x--x 3 service groupSvc 4096 Dec 17 03:08 share service@director-1-1-b:/diag>
-
Si un répertoire « collect-diagnostics-tmp-ext » existe, supprimez-le et exécutez « rm -r collect-diagnostics-tmp-ext »
Remarque : le fichier étendu est généralement utilisé pour examiner les pannes de nœud. Si une panne de nœud est en train d’être examinée et que le support n’a pas capturé tous les journaux nécessaires, vérifiez auprès du support avant de nettoyer le répertoire collect-diagnostics-tmp-ext, car cela pourrait supprimer les fichiers centraux nécessaires.