PowerStore: La adición de un dispositivo a un clúster existente falla con el mensaje "Unconfigured Faulted".

Summary: Durante la instalación del asistente de configuración inicial (ICW) o cuando se agrega un dispositivo a un clúster existente, la tarea falla con el mensaje "Unconfigured Faulted"

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Durante la instalación inicial de un dispositivo en un clúster nuevo, o cuando se agrega un dispositivo nuevo a un clúster existente, hay comprobaciones de hardware y red que pueden fallar. Esta falla puede cambiar el estado del dispositivo de "Sin configurar" a "Falla sin configurar". Este estado significa que el dispositivo no puede unirse a un clúster nuevo, ni agregarse a un clúster existente. La falla se debe borrar antes de que el dispositivo se pueda agregar a un clúster.



 

Cause

Para determinar si hay un problema de hardware o red que esté causando la condición "Falla sin configurar", realice los siguientes pasos:

Resolution

Si va a agregar el dispositivo a un clúster existente (desde PowerStore Manager):

  1. Acceda al sistema mediante el método de acceso al puerto LAN de servicio (consulte PowerStore: Acceso a un nodo para obtener más información).
  2. Una vez que haya iniciado sesión en el contenedor de servicios como usuario de servicio, ejecute el siguiente script de servicio para determinar si hay un problema de hardware o de red: 
    svc_diag list --icw_hardware
    svc_diag list --network

     

  3. Si no se informan errores ni problemas, es posible que los síntomas originales observados durante el ICW o la operación de adición del dispositivo fueran transitorios.
     
  4. Si se indica un error o problema y no puede determinar cómo resolverlo, ejecute el siguiente script para generar una recolección de datos y póngase en contacto con el proveedor de servicios para obtener ayuda: 
    svc_dc run
     
  5. Si está instalando un dispositivo en un clúster nuevo y está listo para reintentar la instalación:
    • Cierre la herramienta de descubrimiento o el navegador. 
    • Vuelva a iniciar la herramienta de descubrimiento o abra el navegador con la dirección IP de LAN de servicio estática para el nodo A [es decir, 128.221.1.252].
    • Si el sistema muestra que está en un estado "Sin configurar", reanude los pasos iniciales de configuración/ICW
    • Vuelva a intentar la operación Agregar dispositivo para ver si la tarea se realiza correctamente.
       
  6. En caso de que la tarea siga fallando, realice una recolección de datos para obtener los registros pertinentes y póngase en contacto con el proveedor de servicios para obtener ayuda.

 

 

El siguiente es un ejemplo de salida correcta de "  svc_diag list --icw_hardware " en la columna de la izquierda; La columna de la derecha contiene explicaciones de los errores que puede ver.

Ejemplo de salida

Descripción

hw_type Warnado-EX
Running on Node A

 

Node A FRU Status

OK | Peer Node | 0x0f80
OK | Local Node | 0x1480
OK | Embedded Module | 0x8b81
OK | 4-Port Card | 0x8b81
OK | I/O Module 0 | 0x8b81
OK | I/O Module 1 | 0x8b81
OK | Internal Backup Battery Module | 0x3380

Node B FRU Status
OK | Peer Node | 0x0f80
OK | Local Node | 0x1580
OK | Embedded Module | 0x8b81
OK | 4-Port Card | 0x8b81
OK | I/O Module 0 | 0x8b81
OK | I/O Module 1 | 0x8b81
OK | Internal Backup Battery Module | 0x1380

Estas tablas constan de tres columnas:

 Resumen | Nombre de la unidad reemplazable en campo (FRU) | Valor del sensor de estado


 La columna Resumen de la izquierda debe leerse de la siguiente manera:

En buen estado = El estado de la FRU es bueno.


Vacío = falta FRU o el dispositivo no la detecta. Dado que los módulos de E/S son opcionales, puede ser normal ver el estado "Vacío" para los módulos de E/S. (En ese caso, las mismas ranuras del módulo de E/S deben estar vacías en ambos nodos). Todas las demás FRU son hardware necesario y siempre deben estar "OK".


Apagado = la FRU está apagada. Es posible que se deba reemplazar la FRU.


Desconocido = El valor del sensor de estado contiene valores inesperados. Es posible que se deba reemplazar la FRU.



 Acción recomendada en caso de falla:  Consulte los artículos relacionados de la base de conocimientos para obtener detalles sobre cómo resolver estos problemas de hardware. Entre ellas se incluyen: 000132703, 000132707 (nodos), 000125540 (módulos de I/O, tarjeta de 4 puertos) y 000132989 (módulo integrado).

IO Module Consistency Check = Success
Node Consistency Check = Success
Battery Check = OK

 

Estas comprobaciones comparan los valores de resumen de estado de FRU de cada nodo. Se espera que ambos nodos informen el mismo valor de resumen para cada FRU.

 

Acción recomendada en caso de falla:

  1. Para los módulos de I/O, consulte el artículo 000125540 de la base de conocimientos.
  2. Para los nodos, consulte los artículos de la base de conocimientos 000132703 y 000132707.
  3. La comprobación del módulo de batería de reserva interno es correcta, a menos que no se pueda leer el estado de la FRU desde uno o ambos nodos. Si esta es la única falla informada por el icw_hardware , reiniciar el ICW debería permitir que pase.
Node A Fault Status Register Status = Success
OK | Node
OK | Embedded Module
OK | Internal Backup Battery Module
Module
        OK | DIMM00
        OK | DIMM01
        OK | DIMM02
        OK | DIMM03
        OK | DIMM04
        OK | DIMM05
        OK | DIMM06
        OK | DIMM07
        OK | DIMM08
        OK | DIMM09
        OK | DIMM10
        OK | DIMM11
        OK | DIMM12
        OK | DIMM13
        OK | DIMM14
        OK | DIMM15
        OK | DIMM16
        OK | DIMM17
        OK | DIMM18
        OK | DIMM19
        OK | DIMM20
        OK | DIMM21
        OK | DIMM22
        OK | DIMM23
OK | I/O Module 0
OK | I/O Module 1
OK | 4-Port Card

Node B Fault Status Register Status = Success
OK | Node
OK | Embedded Module
OK | Internal Backup Battery Module
Module
        OK | DIMM00
        OK | DIMM01
        OK | DIMM02
        OK | DIMM03
        OK | DIMM04
        OK | DIMM05
        OK | DIMM06
        OK | DIMM07
        OK | DIMM08
        OK | DIMM09
        OK | DIMM10
        OK | DIMM11
        OK | DIMM12
        OK | DIMM13
        OK | DIMM14
        OK | DIMM15
        OK | DIMM16
        OK | DIMM17
        OK | DIMM18
        OK | DIMM19
        OK | DIMM20
        OK | DIMM21
        OK | DIMM22
        OK | DIMM23
OK | I/O Module 0
OK | I/O Module 1
OK | 4-Port Card

 

Los valores de estado en la columna de la izquierda son OK o FLT. Estos se leen desde el registro de estado de fallas (FSR).


 Una "FLT" indica que la FRU recibió un error de hardware.


Un "OK" significa que no hay ningún error de hardware registrado para esa FRU. Si no hay una FRU presente, el estado que se muestra en esta tabla debe ser "OK". (Una ranura vacía del módulo de I/O se mostraría como "OK" en estas tablas, pero se mostraría como "Empty" en la tabla de estado de FRU anterior).

 


Acción recomendada en caso de falla:  Consulte los artículos relacionados de la base de conocimientos para obtener detalles sobre cómo resolver estos problemas de hardware. Entre ellas se incluyen: 000132703, 000132707 (nodos), 000125540 (módulos de I/O, tarjeta de 4 puertos) y 000132989 (módulo integrado). 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

NVRAM Cache Drives
Node Core Counts (NodeA:12, NodeB:12)
Number of NVRAM Drives Required based on Core Count: 2
NVRAM Drives Found (NodeA:2, NodeB:2)
NVMe Storage Drives
Number of NVMe Drives Required: 6
SCM Drives Found (NodeA: 0, NodeB: 0)
SSD Drives Found (NodeA: 12 (NVMe 6, SAS 6), NodeB: 12 (NVMe 6, SAS 6))
NVMe Drive Check = Success
compareNodeDrives - NVEe Drive Counts, NodeA 8, NodeB 8
compareNodeDrives - Both Nodes see same NVMe drives
compareNodeDrives - SAS SSD Drive Counts, NodeA 12, NodeB 12
compareNodeDrives - Both Nodes see same drives
Compare Node Drive Check = Success
checkExpansionEnclosures - nodeAEnclCount 2, nodeBEnclCount 2
Enclosure Check = Success

 

 

Las comprobaciones relacionadas con la unidad incluyen:

  1. El dispositivo debe contener la cantidad correcta de unidades de caché NVRAM (la cantidad específica depende del modelo del dispositivo). Acción recomendada si esto indica una falla: Busque unidades NVRAM faltantes, defectuosas o colocadas incorrectamente. La salida del comando "svc_diag list --nvme_drive" puede ser útil.

 

  1. Las unidades de datos en el sistema deben seguir las reglas de configuración oficiales para unidades SCM, SCD y SAS (en este ejemplo, no hay unidades SCM en el dispositivo). Acción recomendada si esto indica una falla: Revise las etiquetas de todas las unidades NVMe y SAS. Si hay una combinación de tipos de unidades SCM y SSD, reemplácelas o quítelas según sea necesario.

 

  1. El mismo número de unidades debe ser visible desde ambos nodos (una unidad que es visible desde un solo nodo causa problemas). Acción recomendada si esto indica una falla: Puede utilizar "svc_diag list --nvme_drive" para mostrar el estado detallado de las unidades NVMe con el fin de identificar qué unidad o unidades son visibles solo en un nodo.

 

  1. El mismo número de gabinetes de unidades debe estar visible desde ambos nodos (un gabinete que es visible desde un solo nodo causa problemas). Acción recomendada si esto indica una falla: Revise todos los cables del gabinete y verifique que estén cableados correctamente.
checkIoms - nodeAIoms: [u' 303-321-000C', u' 313-202-000B']
checkIoms - nodeBIoms: [u' 303-321-000C', u' 313-202-000B']
Compare Node IOM Check = Success

 

El módulo de E/S en cada ranura de un nodo debe coincidir con el módulo de E/S en la misma ranura del nodo par.
 

Esto puede suceder si el tipo incorrecto de módulo de E/S está presente en un nodo. También puede suceder si cada nodo contiene un módulo de I/O, pero están en ranuras diferentes (ejemplo: ranura 0 en un nodo, pero ranura 1 en el nodo par). También puede ver una falla aquí si falta un módulo de E/S o si está apagado (consulte la sección anterior "Registro de estado de falla").


 

Acción recomendada en caso de falla:  Compare los números de pieza de los módulos de E/S en ambas ranuras del módulo de E/S en ambos nodos. Si hay incoherencias, mueva o reemplace los módulos de E/S según sea necesario para corregir el problema. El artículo 000125540 de la base de conocimientos también puede ser útil.

OVERALL STATUS: True, return_code 0
IOM Consistency Check : Success
Node Consistency Check : Success
Battery Check : OK
Fault Status Register A : Success
Fault Status Register B : Success
Node A Accessible : True
Node B Accessible : True
Drive Check : Success
Node Drives Compare Check : Success
Enclosure Check : Success
IO Module Compare Check : Success

Esta sección es un resumen de la información proporcionada anteriormente.


El siguiente es un ejemplo de salida correcta de " svc_diag_list --network" :

Ejemplo de salida

***** Start minimal cabling check *****
OCP_MEZZ 0 is LINK_STATUS_UP on Node A
OCP_MEZZ 0 is LINK_STATUS_UP on Node B
OCP_MEZZ 1 is LINK_STATUS_UP on Node A
OCP_MEZZ 1 is LINK_STATUS_UP on Node B
***** Minimal cabling check: Overall errors: 0
Overall errors: 0, return code: 0

 

Affected Products

PowerStore
Article Properties
Article Number: 000139935
Article Type: Solution
Last Modified: 29 Jul 2025
Version:  7
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.