PowerStore: L'aggiunta di un appliance a un cluster esistente ha esito negativo con errore non configurato.

Summary: Durante l'installazione tramite la procedura guidata di configurazione iniziale (ICW) o quando si aggiunge un appliance a un cluster esistente, l'attività ha esito negativo con errore non configurato. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Durante l'installazione iniziale di un appliance in un nuovo cluster o quando si aggiunge un nuovo appliance a un cluster esistente, alcuni controlli hardware e di rete potrebbero avere esito negativo. Questo errore può modificare lo stato dell'appliance da "Unconfigured" a "Unconfigured Faulted". Questo stato indica che l'appliance non può essere aggiunto a un nuovo cluster o essere aggiunto a un cluster esistente. L'errore deve essere cancellato prima di poter aggiungere l'appliance a un cluster.



 

Cause

Per determinare se è presente un problema hardware o di rete che causa la condizione di errore non configurato , attenersi alla seguente procedura:

Resolution

Se si aggiunge l'appliance a un cluster esistente (da PowerStore Manager):

  1. Accedere al sistema utilizzando il metodo di accesso alla porta LAN di servizio (consultare PowerStore: Accesso a un nodo per i dettagli).
  2. Una volta effettuato l'accesso al Service Container come utente del servizio, eseguire il seguente script di servizio per determinare se è presente un problema hardware o di rete: 
    svc_diag list --icw_hardware
    svc_diag list --network

     

  3. Se non vengono segnalati errori o problemi, è possibile che i sintomi originali osservati durante l'ICW o l'operazione di aggiunta dell'appliance fossero transitori.
     
  4. Se viene indicato un errore o un problema e non si riesce a stabilire come risolverlo, eseguire il seguente script per produrre una raccolta dati e contattare il fornitore di servizi per assistenza: 
    svc_dc run
     
  5. Se si sta installando un appliance in un nuovo cluster e si è pronti a riprovare l'installazione:
    • Chiudi lo strumento di rilevamento e/o il browser. 
    • Riavviare lo strumento di rilevamento o aprire il browser con l'indirizzo IP statico della LAN di servizio per il nodo A [ad esempio, 128.221.1.252].
    • Se il sistema visualizza uno stato "Unconfigured", riprendere i passaggi iniziali di configurazione/ICW
    • Riprovare l'operazione Add Appliance per verificare se l'attività ha esito positivo.
       
  6. Nel caso in cui l'attività non riesca ancora, eseguire una data collection per ottenere i registri pertinenti e contattare il fornitore di servizi per assistenza.

 

 

Di seguito è riportato un esempio di output corretto da "  svc_diag list --icw_hardware " nella colonna di sinistra; La colonna di destra contiene spiegazioni degli errori che è possibile visualizzare.

Risultato di esempio

Descrizione

hw_type Warnado-EX
Running on Node A

 

Node A FRU Status

OK | Peer Node | 0x0f80
OK | Local Node | 0x1480
OK | Embedded Module | 0x8b81
OK | 4-Port Card | 0x8b81
OK | I/O Module 0 | 0x8b81
OK | I/O Module 1 | 0x8b81
OK | Internal Backup Battery Module | 0x3380

Node B FRU Status
OK | Peer Node | 0x0f80
OK | Local Node | 0x1580
OK | Embedded Module | 0x8b81
OK | 4-Port Card | 0x8b81
OK | I/O Module 0 | 0x8b81
OK | I/O Module 1 | 0x8b81
OK | Internal Backup Battery Module | 0x1380

Queste tabelle sono costituite da tre colonne:

 sommario | Nome dell'unità sostituibile sul campo (FRU) | Valore del sensore di stato


 La colonna Riepilogo a sinistra va letta come segue:

OK = lo stato FRU è buono.


Vuoto = FRU mancante e/o non rilevata dall'appliance. Poiché i moduli di I/O sono opzionali, può essere normale visualizzare lo stato "Empty" per i moduli di I/O. (In tal caso, gli stessi slot del modulo di I/O devono essere vuoti su entrambi i nodi). Tutte le altre FRU sono hardware richiesti e devono sempre essere "OK".


Spento = la FRU è spenta. Potrebbe essere necessario sostituire la FRU.


Sconosciuto = Il valore del sensore di stato contiene valori imprevisti. Potrebbe essere necessario sostituire la FRU.



 Azione consigliata in caso di errore:  Per informazioni dettagliate su come risolvere questi problemi hardware, consultare gli articoli della Knowledge Base correlati. tra cui: 000132703, 000132707(nodi), 000125540 (moduli I/O, scheda a 4 porte) e 000132989 (modulo integrato).

IO Module Consistency Check = Success
Node Consistency Check = Success
Battery Check = OK

 

Questi controlli confrontano i valori di riepilogo dello stato FRU di ciascun nodo. Si prevede che entrambi i nodi riportino lo stesso valore di riepilogo per ogni FRU.

 

Azione consigliata in caso di errore:

  1. Per i moduli di I/O, consultare l'articolo 000125540 della Knowledge Base.
  2. Per i nodi, consultare gli articoli 000132703 e 000132707 della Knowledge Base.
  3. Il controllo del modulo della batteria di backup interna è corretto, a meno che lo stato della FRU non possa essere letto da uno o entrambi i nodi. Se questo è l'unico errore segnalato da icw_hardware comando, il riavvio dell'ICW dovrebbe consentirne il passaggio.
Node A Fault Status Register Status = Success
OK | Node
OK | Embedded Module
OK | Internal Backup Battery Module
Module
        OK | DIMM00
        OK | DIMM01
        OK | DIMM02
        OK | DIMM03
        OK | DIMM04
        OK | DIMM05
        OK | DIMM06
        OK | DIMM07
        OK | DIMM08
        OK | DIMM09
        OK | DIMM10
        OK | DIMM11
        OK | DIMM12
        OK | DIMM13
        OK | DIMM14
        OK | DIMM15
        OK | DIMM16
        OK | DIMM17
        OK | DIMM18
        OK | DIMM19
        OK | DIMM20
        OK | DIMM21
        OK | DIMM22
        OK | DIMM23
OK | I/O Module 0
OK | I/O Module 1
OK | 4-Port Card

Node B Fault Status Register Status = Success
OK | Node
OK | Embedded Module
OK | Internal Backup Battery Module
Module
        OK | DIMM00
        OK | DIMM01
        OK | DIMM02
        OK | DIMM03
        OK | DIMM04
        OK | DIMM05
        OK | DIMM06
        OK | DIMM07
        OK | DIMM08
        OK | DIMM09
        OK | DIMM10
        OK | DIMM11
        OK | DIMM12
        OK | DIMM13
        OK | DIMM14
        OK | DIMM15
        OK | DIMM16
        OK | DIMM17
        OK | DIMM18
        OK | DIMM19
        OK | DIMM20
        OK | DIMM21
        OK | DIMM22
        OK | DIMM23
OK | I/O Module 0
OK | I/O Module 1
OK | 4-Port Card

 

I valori di stato nella colonna di sinistra sono OK o FLT. Vengono letti dal registro dello stato dei guasti (FSR).


 Un "FLT" indica che la FRU ha rilevato un errore hardware.


Un "OK" indica che non è stato registrato alcun errore hardware per tale FRU. Se non è presente una FRU, lo stato in questa tabella dovrebbe essere "OK". (Uno slot del modulo di I/O vuoto viene visualizzato come "OK" in queste tabelle, ma viene elencato come "Empty" nella tabella precedente FRU Status).

 


Azione consigliata in caso di errore:  Per informazioni dettagliate su come risolvere questi problemi hardware, consultare gli articoli della Knowledge Base correlati. tra cui: 000132703, 000132707(nodi), 000125540 (moduli I/O, scheda a 4 porte) e 000132989 (modulo integrato). 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

NVRAM Cache Drives
Node Core Counts (NodeA:12, NodeB:12)
Number of NVRAM Drives Required based on Core Count: 2
NVRAM Drives Found (NodeA:2, NodeB:2)
NVMe Storage Drives
Number of NVMe Drives Required: 6
SCM Drives Found (NodeA: 0, NodeB: 0)
SSD Drives Found (NodeA: 12 (NVMe 6, SAS 6), NodeB: 12 (NVMe 6, SAS 6))
NVMe Drive Check = Success
compareNodeDrives - NVEe Drive Counts, NodeA 8, NodeB 8
compareNodeDrives - Both Nodes see same NVMe drives
compareNodeDrives - SAS SSD Drive Counts, NodeA 12, NodeB 12
compareNodeDrives - Both Nodes see same drives
Compare Node Drive Check = Success
checkExpansionEnclosures - nodeAEnclCount 2, nodeBEnclCount 2
Enclosure Check = Success

 

 

I controlli relativi alle unità includono:

  1. L'appliance deve contenere il numero corretto di unità cache NVRAM (il numero specifico dipende dal modello dell'appliance). Azione consigliata se viene visualizzato un errore: Cercare unità NVRAM mancanti, guaste o inserite in modo errato. L'output di "svc_diag list --nvme_drive" può essere utile.

 

  1. Le unità dati nel sistema devono seguire le regole di configurazione ufficiali per le unità SCM, SCD e SAS (in questo esempio, non sono presenti unità SCM nell'appliance). Azione consigliata se viene visualizzato un errore: Controllare le etichette di tutte le unità NVMe e SAS. Se è presente una combinazione di tipi di unità SCM e SSD, sostituire o rimuovere le unità in base alle necessità.

 

  1. Lo stesso numero di unità deve essere visibile da entrambi i nodi (un'unità visibile da un solo nodo causa problemi). Azione consigliata se viene visualizzato un errore: È possibile utilizzare "svc_diag list --nvme_drive" per visualizzare lo stato dettagliato delle unità NVMe per identificare l'unità o le unità visibili solo su un nodo.

 

  1. Lo stesso numero di enclosure di unità deve essere visibile da entrambi i nodi (un enclosure visibile da un solo nodo causa problemi). Azione consigliata se viene visualizzato un errore: Controllare tutti i cavi dell'enclosure e verificare che siano cablati correttamente.
checkIoms - nodeAIoms: [u' 303-321-000C', u' 313-202-000B']
checkIoms - nodeBIoms: [u' 303-321-000C', u' 313-202-000B']
Compare Node IOM Check = Success

 

Il modulo di I/O in ogni slot su un nodo deve corrispondere al modulo di I/O nello stesso slot sul nodo peer.
 

Ciò può verificarsi se in un nodo è presente il tipo errato di modulo di I/O. Può anche accadere se ogni nodo contiene un modulo di I/O ma si trovano in slot diversi (ad esempio, slot 0 su un nodo, ma slot 1 sul nodo peer). È inoltre possibile visualizzare un errore se un modulo di I/O è mancante o spento (vedere la sezione "Registro dello stato di guasto" sopra).


 

Azione consigliata in caso di errore:  Confrontare i numeri parte dei moduli di I/O in entrambi gli slot dei moduli di I/O su entrambi i nodi. In caso di incongruenze, spostare o sostituire i moduli di I/O in base alle esigenze per risolvere il problema. Anche l'articolo 000125540 della Knowledge Base può essere utile.

OVERALL STATUS: True, return_code 0
IOM Consistency Check : Success
Node Consistency Check : Success
Battery Check : OK
Fault Status Register A : Success
Fault Status Register B : Success
Node A Accessible : True
Node B Accessible : True
Drive Check : Success
Node Drives Compare Check : Success
Enclosure Check : Success
IO Module Compare Check : Success

Questa sezione è un riepilogo delle informazioni fornite sopra.


Di seguito è riportato un esempio di output corretto da " svc_diag_list --network" :

Risultato di esempio

***** Start minimal cabling check *****
OCP_MEZZ 0 is LINK_STATUS_UP on Node A
OCP_MEZZ 0 is LINK_STATUS_UP on Node B
OCP_MEZZ 1 is LINK_STATUS_UP on Node A
OCP_MEZZ 1 is LINK_STATUS_UP on Node B
***** Minimal cabling check: Overall errors: 0
Overall errors: 0, return code: 0

 

Affected Products

PowerStore
Article Properties
Article Number: 000139935
Article Type: Solution
Last Modified: 29 Jul 2025
Version:  7
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.