PowerStore. При добавлении устройства в существующий кластер происходит сбой с ошибкой «Unconfigured Faulted».

Summary: Во время установки мастера начальной настройки (ICW) или при добавлении устройства в существующий кластер происходит сбой задачи с ошибкой «Unconfigured Faulted»

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Во время первоначальной установки устройства в новый кластер или при добавлении нового устройства в существующий кластер некоторые проверки оборудования и сети могут завершиться сбоем. Этот сбой может изменить состояние устройства с «Не настроено» на «Не настроено». Это состояние означает, что устройство не может присоединиться к новому кластеру или быть добавлено к существующему кластеру. Перед добавлением устройства в кластер необходимо устранить неисправность.



 

Cause

Чтобы определить, имеется ли проблема с оборудованием или сетью, которая приводит к состоянию «Unconfigured Faulted», выполните следующие действия.

Resolution

Если вы добавляете устройство в существующий кластер (с помощью PowerStore Manager):

  1. Войдите в систему, используя метод доступа к порту сервисной локальной сети (см . PowerStore. Доступ к узлу для получения подробной информации).
  2. Выполнив вход в сервисный контейнер в качестве сервисного пользователя, запустите следующий сервисный сценарий, чтобы определить, связана ли проблема с оборудованием или сетью: 
    svc_diag list --icw_hardware
    svc_diag list --network

     

  3. Если сообщений об ошибках или проблемах не сообщается, возможно, первоначальные признаки, наблюдаемые во время операции ICW или добавления устройства, были временными.
     
  4. Если отображается ошибка или проблема и вы не можете определить, как ее устранить, запустите следующий сценарий для запуска сбора данных и обратитесь за помощью к поставщику услуг: 
    svc_dc run
     
  5. Если вы устанавливаете устройство в новый кластер и готовы повторить попытку установки, выполните следующие действия.
    • Закройте средство обнаружения и/или браузер. 
    • Перезапустите средство обнаружения или откройте браузер, указав статический IP-адрес сервисной локальной сети для узла A [например, 128.221.1.252].
    • Если отображается состояние «Не настроено», возобновите шаги начальной настройки/мастера начальной настройки
    • Повторите операцию добавления устройства, чтобы проверить, успешно ли задача выполнена.
       
  6. Если задача по-прежнему завершается сбоем, выполните сбор данных для получения соответствующих журналов и обратитесь за помощью к своему поставщику услуг.

 

 

Ниже приведен пример успешного вывода команды "  svc_diag list --icw_hardware " в левой колонке; В правом столбце содержатся объяснения ошибок, которые вы можете увидеть.

Пример выходных данных

Описание

hw_type Warnado-EX
Running on Node A

 

Node A FRU Status

OK | Peer Node | 0x0f80
OK | Local Node | 0x1480
OK | Embedded Module | 0x8b81
OK | 4-Port Card | 0x8b81
OK | I/O Module 0 | 0x8b81
OK | I/O Module 1 | 0x8b81
OK | Internal Backup Battery Module | 0x3380

Node B FRU Status
OK | Peer Node | 0x0f80
OK | Local Node | 0x1580
OK | Embedded Module | 0x8b81
OK | 4-Port Card | 0x8b81
OK | I/O Module 0 | 0x8b81
OK | I/O Module 1 | 0x8b81
OK | Internal Backup Battery Module | 0x1380

Эти таблицы состоят из трех столбцов:

 Резюме | Название блока, заменяемого на месте (FRU) | Значение датчика состояния


 Столбец «Сводка » слева следует читать следующим образом:

OK = состояние FRU — «в норме».


Пусто = FRU отсутствует и/или не обнаружен устройством. Поскольку модули ввода-вывода являются опциональными, состояние «Пусто» для модулей ввода-вывода может быть нормальным. (В этом случае одни и те же слоты модулей ввода-вывода должны быть пустыми на обоих узлах.) Для всех остальных FRU требуется аппаратное обеспечение, и для них всегда должно отображаться состояние «OK».


Выключен = FRU выключен. Возможно, потребуется замена FRU.


Неизвестно = значение датчика состояния содержит непредвиденные значения. Возможно, потребуется замена FRU.



 Рекомендуемое действие в случае сбоя.  Подробные сведения о том, как устранить эти проблемы с оборудованием, см. в соответствующих статьях базы знаний. К ним относятся: 000132703, 000132707 (узлы), 000125540 (модули ввода-вывода, 4-портовая плата) и 000132989 (встроенный модуль).

IO Module Consistency Check = Success
Node Consistency Check = Success
Battery Check = OK

 

В ходе этих проверок сравниваются итоговые значения состояния FRU для каждого узла. Ожидается, что оба узла будут сообщать одно и то же суммарное значение для каждого FRU.

 

Рекомендуемое действие в случае сбоя.

  1. Для модулей ввода-вывода см. статью базы знаний 000125540.
  2. Для узлов см. статьи базы знаний 000132703 и 000132707.
  3. Проверка внутреннего модуля резервного аккумулятора выполняется успешно, если состояние FRU не удается прочитать с одного или обоих узлов. Если это единственная ошибка, о которой сообщает icw_hardware перезапуск ICW должен позволить ему пройти.
Node A Fault Status Register Status = Success
OK | Node
OK | Embedded Module
OK | Internal Backup Battery Module
Module
        OK | DIMM00
        OK | DIMM01
        OK | DIMM02
        OK | DIMM03
        OK | DIMM04
        OK | DIMM05
        OK | DIMM06
        OK | DIMM07
        OK | DIMM08
        OK | DIMM09
        OK | DIMM10
        OK | DIMM11
        OK | DIMM12
        OK | DIMM13
        OK | DIMM14
        OK | DIMM15
        OK | DIMM16
        OK | DIMM17
        OK | DIMM18
        OK | DIMM19
        OK | DIMM20
        OK | DIMM21
        OK | DIMM22
        OK | DIMM23
OK | I/O Module 0
OK | I/O Module 1
OK | 4-Port Card

Node B Fault Status Register Status = Success
OK | Node
OK | Embedded Module
OK | Internal Backup Battery Module
Module
        OK | DIMM00
        OK | DIMM01
        OK | DIMM02
        OK | DIMM03
        OK | DIMM04
        OK | DIMM05
        OK | DIMM06
        OK | DIMM07
        OK | DIMM08
        OK | DIMM09
        OK | DIMM10
        OK | DIMM11
        OK | DIMM12
        OK | DIMM13
        OK | DIMM14
        OK | DIMM15
        OK | DIMM16
        OK | DIMM17
        OK | DIMM18
        OK | DIMM19
        OK | DIMM20
        OK | DIMM21
        OK | DIMM22
        OK | DIMM23
OK | I/O Module 0
OK | I/O Module 1
OK | 4-Port Card

 

В левом столбце отображаются следующие состояния — OK или FLT. Данные считываются из регистра состояния сбоя (Fault Status Register, FSR).


 Символ «FLT» указывает на то, что FRU принял аппаратную ошибку.


Значение «OK» означает, что для этого FRU не зарегистрировано никаких аппаратных ошибок. Если FRU отсутствует, в этой таблице должен отображаться статус «OK». (Пустой слот модуля ввода-вывода будет отображаться как «OK» в этих таблицах, но будет указан как «Empty» в таблице состояния FRU выше.)

 


Рекомендуемое действие в случае сбоя.  Подробные сведения о том, как устранить эти проблемы с оборудованием, см. в соответствующих статьях базы знаний. К ним относятся: 000132703, 000132707 (узлы), 000125540 (модули ввода-вывода, 4-портовая плата) и 000132989 (встроенный модуль). 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

NVRAM Cache Drives
Node Core Counts (NodeA:12, NodeB:12)
Number of NVRAM Drives Required based on Core Count: 2
NVRAM Drives Found (NodeA:2, NodeB:2)
NVMe Storage Drives
Number of NVMe Drives Required: 6
SCM Drives Found (NodeA: 0, NodeB: 0)
SSD Drives Found (NodeA: 12 (NVMe 6, SAS 6), NodeB: 12 (NVMe 6, SAS 6))
NVMe Drive Check = Success
compareNodeDrives - NVEe Drive Counts, NodeA 8, NodeB 8
compareNodeDrives - Both Nodes see same NVMe drives
compareNodeDrives - SAS SSD Drive Counts, NodeA 12, NodeB 12
compareNodeDrives - Both Nodes see same drives
Compare Node Drive Check = Success
checkExpansionEnclosures - nodeAEnclCount 2, nodeBEnclCount 2
Enclosure Check = Success

 

 

Проверки, связанные с накопителем, включают:

  1. Устройство должно содержать правильное количество накопителей кэш-памяти NVRAM (точное количество зависит от модели устройства). Рекомендуемое действие в случае выявления ошибки. Проверьте отсутствующие, неисправные или неправильно установленные накопители NVRAM. Выходные данные "svc_diag list --nvme_drive" может быть полезной.

 

  1. Накопители с данными в системе должны соответствовать официальным правилам конфигурации для дисков SCM, SCD и SAS (в данном примере в устройстве нет накопителей SCM). Рекомендуемое действие в случае выявления ошибки. Проверьте ярлыки всех накопителей NVMe и SAS. Если накопители SCM и твердотельных накопителей сочетаются, замените или удалите накопители по мере необходимости.

 

  1. На обоих узлах должно быть видно одинаковое количество дисков (диск, который виден только на одном узле, вызывает проблемы). Рекомендуемое действие в случае выявления ошибки. Вы можете использовать "svc_diag list --nvme_drive" , чтобы отобразить подробные сведения о состоянии накопителей NVMe и определить, какие диски отображаются только на одном узле.

 

  1. С обоих узлов должно быть видно одинаковое количество шасси накопителей (если шасси видно только с одного узла, это вызывает проблемы). Рекомендуемое действие в случае выявления ошибки. Проверьте все кабели полок и убедитесь, что они подключены правильно.
checkIoms - nodeAIoms: [u' 303-321-000C', u' 313-202-000B']
checkIoms - nodeBIoms: [u' 303-321-000C', u' 313-202-000B']
Compare Node IOM Check = Success

 

Модуль ввода-вывода в каждом слоте одного узла должен совпадать с модулем ввода-вывода в том же слоте на одноранговом узле.
 

Это может произойти, если на одном узле присутствует модуль ввода-вывода неправильного типа. Это также может произойти, если каждый узел содержит один модуль ввода-вывода, но они находятся в разных разъемах (например, слот 0 на одном узле и слот 1 на одноранговом узле). Здесь также может отображаться ошибка, если модуль ввода-вывода отсутствует или отключен (см. раздел «Регистрация состояния ошибки» выше).


 

Рекомендуемое действие в случае сбоя.  Сравните номера по каталогу модулей ввода-вывода в обоих разъемах модулей ввода-вывода на обоих узлах. При обнаружении несоответствий переместите или замените модули ввода-вывода для устранения проблемы. Также может быть полезна статья базы знаний 000125540.

OVERALL STATUS: True, return_code 0
IOM Consistency Check : Success
Node Consistency Check : Success
Battery Check : OK
Fault Status Register A : Success
Fault Status Register B : Success
Node A Accessible : True
Node B Accessible : True
Drive Check : Success
Node Drives Compare Check : Success
Enclosure Check : Success
IO Module Compare Check : Success

В этом разделе содержится краткое изложение приведенной выше информации.


Ниже приведен пример успешного вывода команды " svc_diag_list --network" :

Пример выходных данных

***** Start minimal cabling check *****
OCP_MEZZ 0 is LINK_STATUS_UP on Node A
OCP_MEZZ 0 is LINK_STATUS_UP on Node B
OCP_MEZZ 1 is LINK_STATUS_UP on Node A
OCP_MEZZ 1 is LINK_STATUS_UP on Node B
***** Minimal cabling check: Overall errors: 0
Overall errors: 0, return code: 0

 

Affected Products

PowerStore
Article Properties
Article Number: 000139935
Article Type: Solution
Last Modified: 29 Jul 2025
Version:  7
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.