PowerStore : L’ajout d’une appliance à un cluster existant échoue avec le message « Unconfigured Faulted ».

Summary: Lors de l’installation de l’Assistant de configuration initiale (ICW) ou lors de l’ajout d’une appliance à un cluster existant, la tâche échoue avec le message « Unconfigured Faulted »

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Lors de l’installation initiale d’une appliance dans un nouveau cluster, ou lors de l’ajout d’une nouvelle appliance à un cluster existant, certaines vérifications matérielles et réseau peuvent échouer. Cette défaillance peut modifier l’état de l’appliance de « Non configuré » à « Défaillant non configuré ». Cet état signifie que l’appliance ne peut pas rejoindre un nouveau cluster ou être ajoutée à un cluster existant. La panne doit être effacée avant que l’appliance puisse être ajoutée à un cluster.



 

Cause

Afin de déterminer si un problème matériel ou réseau est à l’origine de l’état « Défaillance non configurée », procédez comme suit :

Resolution

Si vous ajoutez l’appliance à un cluster existant (à partir de PowerStore Manager) :

  1. Accédez au système à l’aide de la méthode d’accès au port LAN de service (voir PowerStore : Accessing a Node for details).
  2. Une fois connecté au conteneur de maintenance en tant qu’utilisateur de maintenance, exécutez le script de maintenance suivant pour déterminer s’il existe un problème matériel ou réseau : 
    svc_diag list --icw_hardware
    svc_diag list --network

     

  3. Si aucune erreur ou aucun problème n’est signalé, il est possible que les symptômes d’origine observés lors de l’opération ICW ou d’ajout d’appliance aient été transitoires.
     
  4. Si une erreur ou un problème est indiqué et que vous ne pouvez pas déterminer comment résoudre le problème, exécutez le script suivant pour produire une collecte de données et contactez votre prestataire de service pour obtenir de l’aide : 
    svc_dc run
     
  5. Si vous installez une appliance sur un nouveau cluster et que vous êtes prêt à réessayer l’installation :
    • Fermez l’outil de découverte et/ou votre navigateur. 
    • Relancez l’outil de découverte ou ouvrez le navigateur avec l’adresse IP statique du réseau LAN de service pour le nœud A [par exemple, 128.221.1.252].
    • Si le système indique qu’il est dans un état « Non configuré », reprenez vos étapes de configuration initiale/ICW
    • Réessayez l’opération Add Appliance pour voir si la tâche réussit.
       
  6. Si la tâche échoue toujours, effectuez une collecte de données pour obtenir les journaux pertinents et contactez votre prestataire de service pour obtenir de l’aide.

 

 

Voici un exemple de sortie réussie de "  svc_diag list --icw_hardware » dans la colonne de gauche ; La colonne de droite contient des explications sur les erreurs que vous pouvez voir.

Exemple de sortie

Description

hw_type Warnado-EX
Running on Node A

 

Node A FRU Status

OK | Peer Node | 0x0f80
OK | Local Node | 0x1480
OK | Embedded Module | 0x8b81
OK | 4-Port Card | 0x8b81
OK | I/O Module 0 | 0x8b81
OK | I/O Module 1 | 0x8b81
OK | Internal Backup Battery Module | 0x3380

Node B FRU Status
OK | Peer Node | 0x0f80
OK | Local Node | 0x1580
OK | Embedded Module | 0x8b81
OK | 4-Port Card | 0x8b81
OK | I/O Module 0 | 0x8b81
OK | I/O Module 1 | 0x8b81
OK | Internal Backup Battery Module | 0x1380

Ces tableaux se composent de trois colonnes :

 Résumé | Nom de l’unité remplaçable sur site (FRU) | Valeur du capteur d’état


 La colonne Récapitulatif de gauche doit se lire comme suit :

OK = l’état de la FRU est bon.


Vide = FRU est manquante et/ou non détectée par l’appliance. Les modules d’E/S étant facultatifs, il peut être normal de voir l’état Vide des modules d’E/S. (Dans ce cas, les mêmes logements de module d’E/S doivent être vides sur les deux nœuds.) Toutes les autres FRU sont du matériel obligatoire et doivent toujours être définies sur OK.


Éteint = l’unité FRU est hors tension. Il peut être nécessaire de remplacer le FRU.


Inconnu = la valeur du capteur d’état contient des valeurs inattendues. Il peut être nécessaire de remplacer le FRU.



 Action recommandée en cas d’échec :  Consultez les articles connexes de la base de connaissances pour plus d’informations sur la résolution de ces problèmes matériels. Celles-ci incluent :  000132703, 000132707 (nœuds), 000125540 (modules d’E/S, carte à 4 ports) et 000132989 (module intégré).

IO Module Consistency Check = Success
Node Consistency Check = Success
Battery Check = OK

 

Ces vérifications comparent les valeurs du composant FRU Status Summary de chaque nœud. Les deux nœuds doivent indiquer la même valeur Summary pour chaque FRU.

 

Action recommandée en cas d’échec :

  1. Pour les modules d’E/S, consultez l’article 000125540 de la base de connaissances.
  2. Pour les nœuds, consultez les articles de la base de connaissances 000132703 et 000132707.
  3. La vérification du module de batterie de secours interne est OK, sauf si l’état de la FRU ne peut pas être lu à partir d’un nœud ou des deux. S’il s’agit de la seule défaillance signalée par le icw_hardware , le redémarrage de l’ICW devrait lui permettre de passer.
Node A Fault Status Register Status = Success
OK | Node
OK | Embedded Module
OK | Internal Backup Battery Module
Module
        OK | DIMM00
        OK | DIMM01
        OK | DIMM02
        OK | DIMM03
        OK | DIMM04
        OK | DIMM05
        OK | DIMM06
        OK | DIMM07
        OK | DIMM08
        OK | DIMM09
        OK | DIMM10
        OK | DIMM11
        OK | DIMM12
        OK | DIMM13
        OK | DIMM14
        OK | DIMM15
        OK | DIMM16
        OK | DIMM17
        OK | DIMM18
        OK | DIMM19
        OK | DIMM20
        OK | DIMM21
        OK | DIMM22
        OK | DIMM23
OK | I/O Module 0
OK | I/O Module 1
OK | 4-Port Card

Node B Fault Status Register Status = Success
OK | Node
OK | Embedded Module
OK | Internal Backup Battery Module
Module
        OK | DIMM00
        OK | DIMM01
        OK | DIMM02
        OK | DIMM03
        OK | DIMM04
        OK | DIMM05
        OK | DIMM06
        OK | DIMM07
        OK | DIMM08
        OK | DIMM09
        OK | DIMM10
        OK | DIMM11
        OK | DIMM12
        OK | DIMM13
        OK | DIMM14
        OK | DIMM15
        OK | DIMM16
        OK | DIMM17
        OK | DIMM18
        OK | DIMM19
        OK | DIMM20
        OK | DIMM21
        OK | DIMM22
        OK | DIMM23
OK | I/O Module 0
OK | I/O Module 1
OK | 4-Port Card

 

Les valeurs d’état dans la colonne de gauche sont OK ou FLT. Ils sont lus à partir du registre d’état des pannes (FSR).


 Un « FLT » indique que la FRU a détecté une erreur matérielle.


Un « OK » signifie qu’aucune erreur matérielle n’est enregistrée pour cette FRU. Si aucune FRU n’est présente, l’état dans ce tableau doit être « OK ». (Un logement de module d’E/S vide s’affiche comme « OK » dans ces tableaux, mais est répertorié comme « Vide » dans le tableau d’état FRU ci-dessus.)

 


Action recommandée en cas d’échec :  Consultez les articles connexes de la base de connaissances pour plus d’informations sur la résolution de ces problèmes matériels. Celles-ci incluent :  000132703, 000132707 (nœuds), 000125540 (modules d’E/S, carte à 4 ports) et 000132989 (module intégré). 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

NVRAM Cache Drives
Node Core Counts (NodeA:12, NodeB:12)
Number of NVRAM Drives Required based on Core Count: 2
NVRAM Drives Found (NodeA:2, NodeB:2)
NVMe Storage Drives
Number of NVMe Drives Required: 6
SCM Drives Found (NodeA: 0, NodeB: 0)
SSD Drives Found (NodeA: 12 (NVMe 6, SAS 6), NodeB: 12 (NVMe 6, SAS 6))
NVMe Drive Check = Success
compareNodeDrives - NVEe Drive Counts, NodeA 8, NodeB 8
compareNodeDrives - Both Nodes see same NVMe drives
compareNodeDrives - SAS SSD Drive Counts, NodeA 12, NodeB 12
compareNodeDrives - Both Nodes see same drives
Compare Node Drive Check = Success
checkExpansionEnclosures - nodeAEnclCount 2, nodeBEnclCount 2
Enclosure Check = Success

 

 

Les vérifications liées au disque comprennent :

  1. L’appliance doit contenir le nombre approprié de disques de cache NVRAM (le nombre spécifique dépend du modèle de l’appliance). Action recommandée en cas de défaillance : Recherchez les disques NVRAM manquants, défectueux ou mal installés. La sortie de l' "svc_diag list --nvme_drive" peut être utile.

 

  1. Les lecteurs de données du système doivent suivre les règles de configuration officielles pour les disques SCM, SCD et SAS (dans cet exemple, il n’y a pas de disques SCM dans l’appliance). Action recommandée en cas de défaillance : Vérifiez les étiquettes de tous les disques NVMe et SAS. S’il existe une combinaison de types de disques SCM et SSD, remplacez ou retirez les disques selon les besoins.

 

  1. Le même nombre de disques doit être visible à partir des deux nœuds (un disque qui n’est visible qu’à partir d’un seul nœud pose problème). Action recommandée en cas de défaillance : Vous pouvez utiliser "svc_diag list --nvme_drive" pour afficher l’état détaillé des disques NVMe afin d’identifier le ou les disques qui ne sont visibles que sur un nœud.

 

  1. Le même nombre de boîtiers de disque doit être visible à partir des deux nœuds (un boîtier qui n’est visible qu’à partir d’un seul nœud pose problème). Action recommandée en cas de défaillance : Vérifiez tous les câbles du boîtier et assurez-vous que les boîtiers sont correctement câblés.
checkIoms - nodeAIoms: [u' 303-321-000C', u' 313-202-000B']
checkIoms - nodeBIoms: [u' 303-321-000C', u' 313-202-000B']
Compare Node IOM Check = Success

 

Le module d’E/S de chaque logement d’un nœud doit correspondre au module d’E/S du même logement sur le nœud homologue.
 

Cela peut se produire si le mauvais type de module d’E/S est présent dans un nœud. Cela peut également se produire si chaque nœud contient un module d’E/S, mais qu’ils se trouvent dans des logements différents (exemple : logement 0 sur un nœud, mais logement 1 sur le nœud homologue). Vous pouvez également voir une panne ici si un module d’E/S est manquant ou hors tension (voir la section « Registre des états de panne » ci-dessus).


 

Action recommandée en cas d’échec :  Comparez les numéros de référence des modules d’E/S dans les deux logements de module d’E/S sur les deux nœuds. En cas d’incohérences, déplacez ou remplacez les modules d’E/S en fonction des besoins pour résoudre le problème. L’article 000125540 de la base de connaissances peut également être utile.

OVERALL STATUS: True, return_code 0
IOM Consistency Check : Success
Node Consistency Check : Success
Battery Check : OK
Fault Status Register A : Success
Fault Status Register B : Success
Node A Accessible : True
Node B Accessible : True
Drive Check : Success
Node Drives Compare Check : Success
Enclosure Check : Success
IO Module Compare Check : Success

Cette section est un récapitulatif des informations fournies ci-dessus.


Voici un exemple de sortie réussie de " svc_diag_list --network" :

Exemple de sortie

***** Start minimal cabling check *****
OCP_MEZZ 0 is LINK_STATUS_UP on Node A
OCP_MEZZ 0 is LINK_STATUS_UP on Node B
OCP_MEZZ 1 is LINK_STATUS_UP on Node A
OCP_MEZZ 1 is LINK_STATUS_UP on Node B
***** Minimal cabling check: Overall errors: 0
Overall errors: 0, return code: 0

 

Affected Products

PowerStore
Article Properties
Article Number: 000139935
Article Type: Solution
Last Modified: 29 Jul 2025
Version:  7
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.