PowerStore: A adição de um equipamento a um cluster existente apresenta falha com a mensagem "Unconfigured Faulted".

Summary: Durante a instalação do Assistente de Configuração Inicial (ICW) ou ao adicionar um equipamento a um cluster existente, a tarefa falha com "Unconfigured Faulted"

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Durante a instalação inicial de um equipamento em um novo cluster ou ao adicionar um novo equipamento a um cluster existente, as verificações de hardware e rede podem falhar. Essa falha pode alterar o status do equipamento de "Unconfigured" para "Unconfigured Faulted". Esse estado significa que o equipamento não pode ingressar em um novo cluster ou ser adicionado a um cluster existente. A falha deve ser removida antes que o equipamento possa ser adicionado a um cluster.



 

Cause

Para determinar se há um problema de hardware ou rede que esteja causando a condição "Unconfigured Faulted", execute as seguintes etapas:

Resolution

Se você estiver adicionando o equipamento a um cluster existente (no PowerStore Manager):

  1. Acessar o sistema usando o método de acesso à porta LAN de serviço (consulte PowerStore: Acessando um nó para obter detalhes).
  2. Depois de fazer logon no contêiner de serviço como usuário de serviço, execute o seguinte script de serviço para determinar se há um problema de hardware ou de rede: 
    svc_diag list --icw_hardware
    svc_diag list --network

     

  3. Se nenhum erro ou problema for relatado, é possível que os sintomas originais vistos durante a operação ICW ou adicionar equipamento tenham sido transitórios.
     
  4. Se um erro ou problema for indicado e você não puder determinar como resolver, execute o seguinte script para produzir uma coleta de dados e entre em contato com seu provedor de serviços para obter assistência: 
    svc_dc run
     
  5. Se você estiver instalando um equipamento em um novo cluster e estiver pronto para tentar instalar novamente:
    • Feche a Discovery Tool e/ou o navegador. 
    • Reinicie a Discovery Tool ou abra o navegador com o endereço IP estático da LAN de serviço para o nó A [ou seja, 128.221.1.252].
    • Se o sistema exibir que está em um estado "Unconfigured", retome as etapas iniciais de configuração/ICW
    • Repita a operação Add Appliance para ver se a tarefa foi bem-sucedida.
       
  6. Caso a tarefa ainda falhe, realize uma coleta de dados para obter os registros relevantes e entre em contato com o provedor de serviços para obter assistência.

 

 

Veja a seguir um exemplo de saída bem-sucedida de "  svc_diag list --icw_hardware " na coluna da esquerda; A coluna da direita contém explicações de erros que você pode ver.

Exemplo de resultado

Descrição

hw_type Warnado-EX
Running on Node A

 

Node A FRU Status

OK | Peer Node | 0x0f80
OK | Local Node | 0x1480
OK | Embedded Module | 0x8b81
OK | 4-Port Card | 0x8b81
OK | I/O Module 0 | 0x8b81
OK | I/O Module 1 | 0x8b81
OK | Internal Backup Battery Module | 0x3380

Node B FRU Status
OK | Peer Node | 0x0f80
OK | Local Node | 0x1580
OK | Embedded Module | 0x8b81
OK | 4-Port Card | 0x8b81
OK | I/O Module 0 | 0x8b81
OK | I/O Module 1 | 0x8b81
OK | Internal Backup Battery Module | 0x1380

Essas tabelas consistem em três colunas:

 Resumo | Nome da unidade substituível em campo (FRU) | Valor do sensor de status


 A coluna Resumo à esquerda deve ter a seguinte redação:

OK = o status da FRU é bom.


Vazia = A FRU está ausente e/ou não foi detectada pelo equipamento. Como os módulos de E/S são opcionais, pode ser normal ver o status "Vazio" para os módulos de E/S. (Nesse caso, os mesmos slots do módulo de E/S devem estar vazios em ambos os nós.) Todas as outras FRUs são hardware obrigatório e devem estar sempre em estado "OK".


Desligado = a FRU está desligada. Pode ser necessário substituir a FRU.


Unknown = O valor do sensor de status contém valores inesperados. Pode ser necessário substituir a FRU.



 Ação recomendada para caso de falha:  Consulte os artigos da KB relacionados para obter detalhes sobre como resolver esses problemas de hardware. São eles: 000132703, 000132707 (nós), 000125540 (módulos de E/S, placa de 4 portas) e 000132989 (módulo incorporado).

IO Module Consistency Check = Success
Node Consistency Check = Success
Battery Check = OK

 

Essas verificações comparam os valores do FRU Status Summary de cada nó. Espera-se que ambos os nós relatem o mesmo valor Summary para cada FRU.

 

Ação recomendada para caso de falha:

  1. Para módulos de E/S, consulte o artigo da base de conhecimento 000125540.
  2. Para obter os nós, consulte os artigos da base de conhecimento 000132703 e 000132707.
  3. A verificação do módulo da bateria de backup interno é OK, a menos que o status da FRU não possa ser lido de um ou ambos os nós. Se essa for a única falha relatada pelo icw_hardware , reiniciar o ICW deve permitir que ele seja aprovado.
Node A Fault Status Register Status = Success
OK | Node
OK | Embedded Module
OK | Internal Backup Battery Module
Module
        OK | DIMM00
        OK | DIMM01
        OK | DIMM02
        OK | DIMM03
        OK | DIMM04
        OK | DIMM05
        OK | DIMM06
        OK | DIMM07
        OK | DIMM08
        OK | DIMM09
        OK | DIMM10
        OK | DIMM11
        OK | DIMM12
        OK | DIMM13
        OK | DIMM14
        OK | DIMM15
        OK | DIMM16
        OK | DIMM17
        OK | DIMM18
        OK | DIMM19
        OK | DIMM20
        OK | DIMM21
        OK | DIMM22
        OK | DIMM23
OK | I/O Module 0
OK | I/O Module 1
OK | 4-Port Card

Node B Fault Status Register Status = Success
OK | Node
OK | Embedded Module
OK | Internal Backup Battery Module
Module
        OK | DIMM00
        OK | DIMM01
        OK | DIMM02
        OK | DIMM03
        OK | DIMM04
        OK | DIMM05
        OK | DIMM06
        OK | DIMM07
        OK | DIMM08
        OK | DIMM09
        OK | DIMM10
        OK | DIMM11
        OK | DIMM12
        OK | DIMM13
        OK | DIMM14
        OK | DIMM15
        OK | DIMM16
        OK | DIMM17
        OK | DIMM18
        OK | DIMM19
        OK | DIMM20
        OK | DIMM21
        OK | DIMM22
        OK | DIMM23
OK | I/O Module 0
OK | I/O Module 1
OK | 4-Port Card

 

Os valores de status na coluna à esquerda são OK ou FLT. Eles são lidos a partir do Registro de status de falha (FSR).


 Um "FLT" indica que a FRU apresentou um erro de hardware.


Um "OK" significa que não há nenhum erro de hardware registrado para essa FRU. Se uma FRU não estiver presente, o status nesta tabela deverá ser "OK". (Um slot vazio do módulo de E/S seria mostrado como "OK" nessas tabelas, mas seria listado como "Vazio" na tabela de status da FRU acima.)

 


Ação recomendada para caso de falha:  Consulte os artigos da KB relacionados para obter detalhes sobre como resolver esses problemas de hardware. São eles: 000132703, 000132707 (nós), 000125540 (módulos de E/S, placa de 4 portas) e 000132989 (módulo incorporado). 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

NVRAM Cache Drives
Node Core Counts (NodeA:12, NodeB:12)
Number of NVRAM Drives Required based on Core Count: 2
NVRAM Drives Found (NodeA:2, NodeB:2)
NVMe Storage Drives
Number of NVMe Drives Required: 6
SCM Drives Found (NodeA: 0, NodeB: 0)
SSD Drives Found (NodeA: 12 (NVMe 6, SAS 6), NodeB: 12 (NVMe 6, SAS 6))
NVMe Drive Check = Success
compareNodeDrives - NVEe Drive Counts, NodeA 8, NodeB 8
compareNodeDrives - Both Nodes see same NVMe drives
compareNodeDrives - SAS SSD Drive Counts, NodeA 12, NodeB 12
compareNodeDrives - Both Nodes see same drives
Compare Node Drive Check = Success
checkExpansionEnclosures - nodeAEnclCount 2, nodeBEnclCount 2
Enclosure Check = Success

 

 

As verificações relacionadas à unidade incluem:

  1. O equipamento deve conter o número correto de unidades de cache NVRAM (o número específico depende do modelo do equipamento). Ação recomendada se isso mostrar uma falha: Procure unidades NVRAM ausentes, com falha ou instaladas incorretamente. O resultado do "svc_diag list --nvme_drive" pode ser útil.

 

  1. As unidades de dados no sistema devem seguir as regras de configuração oficiais para unidades SCM, SCD e SAS (neste exemplo, não há unidades SCM no equipamento). Ação recomendada se isso mostrar uma falha: Verifique as etiquetas das unidades de todas as unidades NVMe e SAS. Se houver uma combinação de tipos de unidade SCM e SSD, substitua ou remova as unidades conforme necessário.

 

  1. O mesmo número de unidades deve estar visível nos dois nós (uma unidade visível de apenas um nó causa problemas). Ação recomendada se isso mostrar uma falha: Você pode usar "svc_diag list --nvme_drive" para exibir status detalhado sobre unidades NVMe para identificar qual unidade ou unidades são visíveis apenas em um nó.

 

  1. O mesmo número de compartimentos de unidade deve estar visível nos dois nós (um compartimento visível de apenas um nó causa problemas). Ação recomendada se isso mostrar uma falha: Verifique todos os cabos do compartimento e verifique se os compartimentos estão conectados corretamente.
checkIoms - nodeAIoms: [u' 303-321-000C', u' 313-202-000B']
checkIoms - nodeBIoms: [u' 303-321-000C', u' 313-202-000B']
Compare Node IOM Check = Success

 

O módulo de E/S em cada slot em um nó deve corresponder ao módulo de E/S no mesmo slot no nó par.
 

Isso pode acontecer se o tipo errado de módulo de E/S estiver presente em um nó. Isso também pode acontecer se cada nó contiver um módulo de E/S, mas eles estiverem em slots diferentes (exemplo: slot 0 em um nó, mas slot 1 no nó par). Você também poderá ver uma falha aqui se um módulo de E/S estiver ausente ou desligado (consulte a seção "Registro de status de falha" acima).


 

Ação recomendada para caso de falha:  Compare os números de peça dos módulos de E/S em ambos os slots de módulo de E/S em ambos os nós. Se houver alguma inconsistência, mova ou substitua os módulos de E/S conforme necessário para corrigir o problema. O artigo 000125540 da KB também pode ser útil.

OVERALL STATUS: True, return_code 0
IOM Consistency Check : Success
Node Consistency Check : Success
Battery Check : OK
Fault Status Register A : Success
Fault Status Register B : Success
Node A Accessible : True
Node B Accessible : True
Drive Check : Success
Node Drives Compare Check : Success
Enclosure Check : Success
IO Module Compare Check : Success

Esta seção é um resumo das informações fornecidas acima.


Veja a seguir um exemplo de saída bem-sucedida de " svc_diag_list --network" :

Exemplo de resultado

***** Start minimal cabling check *****
OCP_MEZZ 0 is LINK_STATUS_UP on Node A
OCP_MEZZ 0 is LINK_STATUS_UP on Node B
OCP_MEZZ 1 is LINK_STATUS_UP on Node A
OCP_MEZZ 1 is LINK_STATUS_UP on Node B
***** Minimal cabling check: Overall errors: 0
Overall errors: 0, return code: 0

 

Affected Products

PowerStore
Article Properties
Article Number: 000139935
Article Type: Solution
Last Modified: 29 Jul 2025
Version:  7
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.