Metro node : Comment collecter les journaux à partir de Metro Node

Summary: Cet article décrit les étapes de collecte des fichiers log à partir de Metro Node et décrit également les journaux/données qui peuvent être nécessaires en cas de problème de performances. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

Étapes pour effectuer les tâches suivantes :

  1. Quels journaux sont nécessaires pour déboguer les problèmes de Metro Node ?
  2. Comment capturer collect-diagnostics sur un cluster Metro Node ?
  3. Comment valider les packages collect-diagnostics existants sur les serveurs de gestion ?
  4. Comment annuler et nettoyer un collect-diagnostics en cours dans Metro Node ?

Un. Quels journaux sont nécessaires pour déboguer les problèmes de Metro Node ?

  1. La commande requise pour collecter les logs à partir de Metro Node s’appelle « collect-diagnostics » et peut être exécutée à partir de n’importe quel nœud (*1) dans la configuration Metro Node. L’exécution de cette commande sur un directeur d’un cluster Metro Node doit disposer de toutes les données de tous les directeurs de tous les nœuds d’un cluster. N’exécutez PAS cette commande sur plusieurs nœuds à la fois.

    *1 REMARQUE : Exécutez la commande « collect-diagnostics » à partir d’un seul directeur, sur un seul cluster si une configuration Metro, et attendez qu’elle se termine complètement avant de rassembler les CD d’un autre directeur ou du cluster homologue, si nécessaire.
  2. La commande « collect-diagnostics » génère un fichier journal tar.gz compressé contenant les fichiers de configuration et les fichiers journaux. Le fichier collect-diagnostics est placé dans le répertoire /diag/collect-diagnostics-out/ sur le nœud depuis lequel il a été exécuté. Une fois la commande terminée, utilisez WINSCP ou un utilitaire SCP équivalent pour copier le fichier hors du nœud. Il peut ensuite être fourni pour la prise en charge de l’analyse. Plus d’informations sur l’utilisation de cette commande sont disponibles dans la section B ci-dessous.

    Remarques :
    • si la commande « collect-diagnostics » est exécutée sans option, deux fichiers sont générés : un fichier de base et un fichier étendu. Cela peut prendre beaucoup de temps sur les systèmes évolutifs.
    • La prise en charge de Metro node ne nécessite généralement que le fichier de base, mais dans certaines circonstances, pour des problèmes de performances, ils peuvent également demander le fichier étendu.
    • Options standard qu’il faut parfois utiliser lors de l’exécution de collect-diagnostics :
      • »--noextended": Cette option omet la collecte des diagnostics étendus.
      • »--last-logs": Cette option capture les journaux x nombre d’heures ou de jours.
    • Pour plus de détails sur la commande, vous pouvez saisir « collect-diagnostics -h »

    Voici des exemples de ces deux noms de fichiers. La date et l’heure, indiquées par YYYY-MM-DD-HH.MM.SS, correspondent à la date et à l’heure auxquelles ces noms ont été collectés :

    • Fichier de base : <Serial number>-c1-diag-YYYY-MM-DD-HH.MM.SS.tar.gz
    • Fichier étendu : <Serial number>-c1-diag-ext-YYYY-MM-DD-HH.MM.SS.tar.gz
  3. Les problèmes de performances sont complexes et nécessitent la collecte de nombreuses informations spécifiques. C’est pourquoi nous proposons un questionnaire de performances que les clients sont invités à remplir pour accélérer ce processus. Vous trouverez ce questionnaire dans la section Pièces jointes à la fin de cet article de la base de connaissances.

  4. Dans certains types de problèmes de performances, il est utile de capturer un journal supplémentaire appelé « fe_perf_stats ». Les journaux sont générés en continu, mais ne sont pas capturés par la commande collect-diagnostics. Pour capturer ce journal, utilisez cd (changer de répertoire) sur /var/log/VPlex/cli sur un nœud de chaque cluster et exécutez la commande « tar cvzf fe-perf-stats.tar.gz fe_perf_stats* » pour compresser les données des fichiers dans un fichier tar. Connectez-vous au nœud avec WINSCP ou un utilitaire SCP équivalent, puis accédez à /var/log/VPlex/cli. Copiez le fichier « fe-perf-stats.tar.gz » sur votre système. Téléchargez le fichier tar ainsi qu’un ou plusieurs fichiers collect-diagnostics, si vous y êtes invité par le support, sur la demande de service ou sur un lien FTP que le support vous fournit dans la demande de service, ainsi qu’un e-mail.

  5. En plus de collecter les diagnostics, il peut être utile de capturer les informations suivantes :

    • Open logging pour une session putty,
    • Exécutez ensuite les commandes ci-dessous,
    • Ensuite, collectez le journal Putty et téléchargez-le sur votre système,
    • Ensuite, joignez le journal PuTTY, collect-diagnostics et toutes les autres données demandées à la demande de service.

    Les commandes suivantes doivent être exécutées à partir de l’invite VPlexcli.

    1. cluster status
    2. ll clusters/**/storage-views/* --full
    3. ll ~ports
    4. show-use-hierarchy /clusters/**/virtual-volumes/*
    5. ll ~system-volumes
    6. ls -t /clusters/*/directors/*::serial-number (cette commande répertorie tous les DST pour chaque nœud)
    7. ls -t /clusters/**/director-*/::hostname (les noms d’hôte affichés correspondent aux adresses IP, ce qui est normal)

B. Comment capturer collect-diagnostics sur un cluster Metro Node ?

Remarque : le fichier de base, qui couvre les 30 derniers jours, est suffisant pour étudier et résoudre la plupart des problèmes. Ces options doivent être utilisées, sauf indication contraire du support.
Pour capturer ces données, exécutez une commande collect-diagnostics avec les balises suivantes : « --noextended » et « --last-logs 30d ».
  1. Établissez une session SSH à l’invite Linux d’un nœud directeur, par exemple, service@director-1-1-a, puis connectez-vous à vplexcli.

    Exemple de résultat :

    login as: service
    Keyboard-interactive authentication prompts from server:
    | Password:
    End of keyboard-interactive prompts from server
    Last login: <date and timestamp data> from x.x.x.x
    service@director-1-1-a:~>
    service@director-1-1-a:~> vplexcli
    Trying ::1...
    Connected to localhost.
    Escape character is '^]'.
    
    VPlexcli:/>
  2. Pour lancer la collecte des diagnostics, depuis la fenêtre de commande vplexcli, exécutez la commande « collect-diagnostics » avec les options de direction comme indiqué dans l’exemple ci-dessous.

    Exemple de résultat :

    VPlexcli:/> collect-diagnostics --noextended --last-logs 30d 
    
    ('WARNING:The collect-diagnostics command was issued with option --noextended.
    ',) 
    
    The following file(s) will NOT be collected: 
    
            core files 
            fast trace dump files 
            slow trace dump files 
            udcom trace dump files 
            udcom legacy trace files 
            user-defined performance sink files 
            the management console's heap 
    
    ('WARNING:Only the logs that are generated in the last 30 days are collected.') 
    
    2024-02-09 19:55:12 UTC: ****Initializing collect-diagnostics... 
    2024-02-09 19:55:13 UTC: No cluster-witness server found. 
    2024-02-09 19:55:13 UTC: Free space = 88G 
    2024-02-09 19:55:13 UTC: Total space needed = 1907M 
    
    ================================================================================ 
    
    Starting collect-diagnostics, this operation might take a while... 
    
    ================================================================================ 
    
    Executing cluster collection ..

C. Comment valider les packages collect-diagnostics existants sur le directeur/nœud.

  1. Lorsque la commande collect-diagnostics se termine et revient à l’invite vplexcli, connectez-vous au directeur à partir duquel vous avez exécuté la commande à l’aide de winscp [ou de l’utilitaire SCP équivalent] et accédez au dossier /diag/collect-diagnostics-out/

  2. Identifiez un ou plusieurs fichiers journaux avec l’horodatage correct et téléchargez-les sur votre station de travail locale.

D. Comment annuler un collect-diagnostics en cours

Remarque : Il s’agit d’une activité sans interruption. Étant donné qu’il n’y a pas de commandes directes pour annuler le processus de collecte, vous devez redémarrer la console de gestion. Toutefois, avant d’abandonner un collect-diagnostics en cours d’exécution, contactez le support pour expliquer pourquoi vous souhaitez annuler l’exécution du collect-diagnostics afin de vous assurer qu’il est correct, car des données peuvent être perdues. Ces données perdues ne sont pas disponibles pour la collecte lorsque collect-diagnostics sont réexécutés après l’action d’annulation.
  1. Si vous êtes toujours dans la session PuTTY où vous avez démarré collect-diagnostics, vous devriez voir le flux de sortie collect-diagnostics en cours d’exécution.

    Exemple de sortie :

    VPlexcli:/> collect-diagnostics --noextended --last-logs 30d 
    
    ('WARNING:The collect-diagnostics command was issued with option --noextended.
    ',) 
    
    The following file(s) will NOT be collected: 
    
            core files 
            fast trace dump files 
            slow trace dump files 
            udcom trace dump files 
            udcom legacy trace files 
            user-defined performance sink files 
            the management console's heap 
    
    ('WARNING:Only the logs that are generated in the last 30 days are collected.') 
    
    2022-02-09 19:55:12 UTC: ****Initializing collect-diagnostics... 
    2022-02-09 19:55:13 UTC: No cluster-witness server found. 
    2022-02-09 19:55:13 UTC: Free space = 88G 
    2022-02-09 19:55:13 UTC: Total space needed = 1907M 
    
    ================================================================================ 
    
    Starting collect-diagnostics, this operation might take a while... 
    
    ================================================================================ 
    
    Executing cluster collection ..
  2. Ouvrez une session PuTTY en double et connectez-vous au directeur sur lequel vous avez lancé la commande collect-diagnostics à l’aide du compte de service.

    Exemple de sortie :

    login as: service 
    Using keyboard-interactive authentication. 
    Password: 
    Last login: <date and time stamp data> from x.x.x.x 
    service@director-1-1-b:~>
  3. Une fois sur le directeur, redémarrez la console de gestion à l’aide de la commande suivante pour annuler le collect-diagnostics en cours d’exécution.

    Exemple de sortie :

    service@director-1-1-b:~> sudo systemctl restart VPlexManagementConsole.service
  4. Lors du redémarrage de la console de gestion, vous devriez consulter le rapport collect-diagnostics suivant comme dernière sortie notée :

    "Connection closed by foreign host."

    Exemple de sortie (vérifiez la dernière ligne de la sortie) :

    VPlexcli:/> collect-diagnostics --noextended --last-logs 30d 
    
    ('WARNING:The collect-diagnostics command was issued with option --noextended.
    ',) 
    
    The following file(s) will NOT be collected: 
    
            core files 
            fast trace dump files 
            slow trace dump files 
            udcom trace dump files 
            udcom legacy trace files 
            user-defined performance sink files 
            the management console's heap 
    
    ('WARNING:Only the logs that are generated in the last 30 days are collected.') 
    
    2022-02-09 20:02:03 UTC: ****Initializing collect-diagnostics... 
    2022-02-09 20:02:04 UTC: No cluster-witness server found. 
    2022-02-09 20:02:04 UTC: Free space = 88G 
    2022-02-09 20:02:04 UTC: Total space needed = 1907M 
    
    ================================================================================ 
    
    Starting collect-diagnostics, this operation might take a while... 
    
    ================================================================================ 
    
    Executing cluster collection ..                               ERROR 
    Executing SMS log collection ..                               Connection closed by foreign host. <<<
  5. Une fois que collect-diagnostics est arrêté, étape 3 ci-dessus, revenez à la deuxième session PuTTY et 'cd' dans le répertoire /diag, puis exécutez 'will' et vous devriez voir des répertoires supplémentaires,

    • collect-diagnostics-tmp
    • collect-diagnostics-jobs
    • collect-diagnostics-tmp-ext*
      *si les fichiers étendus n’ont pas été omis

    Exemple de résultat :

    service@director-1-1-b:/diag> ll 
    total 32 
    drwxr-xr-x 2 service groupSvc  4096 Feb  9 20:03 collect-diagnostics-tmp-ext
    drwxr-xr-x 2 service groupSvc  4096 Feb  9 20:03 collect-diagnostics-jobs 
    drwxr-xr-x 2 service groupSvc  4096 Feb  9 20:04 collect-diagnostics-out 
    drwxr-xr-x 3 service groupSvc  4096 Feb  9 20:02 collect-diagnostics-tmp 
    drwx------ 2 root    root     16384 Jan 27 16:54 lost+found 
    drwx--x--x 3 service groupSvc  4096 Dec 17 03:08 share 
    service@director-1-1-b:/diag>
  6. Si vous regardez à l’intérieur de chacun de ces répertoires, vous voyez des fichiers avec la date et l’heure où vous avez démarré la collecte de diagnostics maintenant annulée. Ces fichiers occupent de l’espace dans la partition /diag et doivent être supprimés.

  7. Pour retirer/supprimer les fichiers du répertoire /diag, saisissez « rm -r collect-diagnostics-jobs » et « rm -r collect-diagnostics-tmp », puis saisissez à nouveau « ll » pour vous assurer que les répertoires ont été supprimés ou supprimés.

    Exemple de résultat :

    service@director-1-1-b:/diag> rm -r collect-diagnostics-jobs 
    service@director-1-1-b:/diag> rm -r collect-diagnostics-tmp 
    
    service@director-1-1-b:/diag> ll 
    total 24 
    drwxr-xr-x 2 service groupSvc  4096 Feb  9 20:04 collect-diagnostics-out 
    drwx------ 2 root    root     16384 Jan 27 16:54 lost+found 
    drwx--x--x 3 service groupSvc  4096 Dec 17 03:08 share 
    service@director-1-1-b:/diag>
  8. Si un répertoire « collect-diagnostics-tmp-ext » existe, supprimez-le et exécutez « rm -r collect-diagnostics-tmp-ext »

    Remarque : le fichier étendu est généralement utilisé pour examiner les pannes de nœud. Si une panne de nœud est en train d’être examinée et que le support n’a pas capturé tous les journaux nécessaires, vérifiez auprès du support avant de nettoyer le répertoire collect-diagnostics-tmp-ext, car cela pourrait supprimer les fichiers centraux nécessaires.

 

Affected Products

metro node mn-114, metro node mn-215
Article Properties
Article Number: 000197436
Article Type: How To
Last Modified: 01 Jul 2025
Version:  8
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.