PowerStore: Додавання пристрою до існуючого кластера не вдається з повідомленням «Unconfigured Faulted».

Summary: Під час інсталяції майстра початкової конфігурації (ICW) або під час додавання пристрою до існуючого кластера завдання не виконується з повідомленням «Unconfigured Faulted»

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Під час початкового встановлення пристрою до нового кластера або під час додавання нового пристрою до наявного кластера існують перевірки обладнання та мережі, які можуть вийти з ладу. Ця помилка може змінити стан приладу з «Не налаштовано» на «Не налаштовано Несправно». Цей стан означає, що базова система не може приєднатися до нового кластера або бути доданою до існуючого кластера. Несправність повинна бути усунена, перш ніж прилад можна буде додати до кластера.



 

Cause

Щоб визначити, чи є проблема з обладнанням або мережею, яка спричиняє стан «Неналаштовано несправно», виконайте такі дії:

Resolution

Якщо ви додаєте пристрій до існуючого кластера (з PowerStore Manager):

  1. Доступ до системи здійснюється за допомогою методу доступу до порту сервісної локальної мережі (див. PowerStore: Доступ до вузла для отримання детальної інформації).
  2. Увійшовши в Service Container як користувач сервісу, запустіть наступний сценарій Service, щоб визначити, чи є проблема з обладнанням або мережею: 
    svc_diag list --icw_hardware
    svc_diag list --network

     

  3. Якщо не повідомляється про помилки або проблеми, можливо, початкові симптоми, які спостерігалися під час роботи ICW або додаткового пристрою, були тимчасовими.
     
  4. Якщо відображається помилка або проблема, а ви не можете визначити, як її вирішити, запустіть наведений нижче сценарій, щоб створити збір даних, і зверніться по допомогу до свого постачальника послуг: 
    svc_dc run
     
  5. Якщо ви встановлюєте прилад у новий кластер і готові повторити спробу встановлення:
    • Закрийте програму Discovery Tool та/або браузер. 
    • Перезапустіть Discovery Tool або відкрийте браузер зі статичною IP-адресою локальної мережі служби для вузла A [тобто 128.221.1.252].
    • Якщо система відображає, що вона знаходиться в стані «Не налаштовано», відновіть початкові кроки налаштування/ICW
    • Повторіть спробу операції «Додати пристрій», щоб перевірити, чи успішно виконано завдання.
       
  6. Якщо завдання все одно не вдається, виконайте збір даних, щоб отримати відповідні журнали, і зверніться до свого постачальника послуг за допомогою.

 

 

Нижче наведено приклад успішного виведення з «  svc_diag list --icw_hardware " в лівій колонці; У правій колонці містяться пояснення помилок, які ви можете побачити.

Приклад виводу

Опис

hw_type Warnado-EX
Running on Node A

 

Node A FRU Status

OK | Peer Node | 0x0f80
OK | Local Node | 0x1480
OK | Embedded Module | 0x8b81
OK | 4-Port Card | 0x8b81
OK | I/O Module 0 | 0x8b81
OK | I/O Module 1 | 0x8b81
OK | Internal Backup Battery Module | 0x3380

Node B FRU Status
OK | Peer Node | 0x0f80
OK | Local Node | 0x1580
OK | Embedded Module | 0x8b81
OK | 4-Port Card | 0x8b81
OK | I/O Module 0 | 0x8b81
OK | I/O Module 1 | 0x8b81
OK | Internal Backup Battery Module | 0x1380

Ці таблиці складаються з трьох стовпців:

 Підсумки | Назва польово-замінного блоку (FRU) | Значення датчика стану


 Колонку «Підсумок» зліва слід читати так:

OK = статус FRU хороший.


Порожній = FRU відсутній та/або не виявлений приладом. Оскільки модулі вводу/виводу є необов'язковими, може бути нормальним бачити статус «Порожньо» для модулів вводу/виводу. (У цьому випадку однакові слоти модуля вводу/виводу мають бути порожніми на обох вузлах.) Всі інші FRU є обов'язковими апаратними засобами і завжди повинні бути в порядку.


Вимкнено = FRU вимкнено. Можливо, буде потрібно замінити FRU.


Невідомо = значення датчика стану містить неочікувані значення. Можливо, буде потрібно замінити FRU.



 Рекомендовані дії при невдачі:  Зверніться до відповідних статей бази знань, щоб дізнатися більше про те, як вирішити ці проблеми з обладнанням. До них відносяться: 000132703, 000132707 (вузли), 000125540 (модулі вводу/виводу, 4-портова карта) та 000132989 (вбудований модуль).

IO Module Consistency Check = Success
Node Consistency Check = Success
Battery Check = OK

 

Під час цих перевірок порівнюються значення зведеного статусу FRU з кожного вузла. Очікується, що обидва вузли повідомлятимуть про однакове зведене значення для кожного FRU.

 

Рекомендовані дії при невдачі:

  1. Щодо модулів вводу/виводу зверніться до статті KB 000125540.
  2. Щодо вузлів, зверніться до статей у базі знань 000132703 та 000132707.
  3. Перевірка модуля внутрішньої резервної батареї допустима, якщо статус FRU не може бути прочитаний з одного або обох вузлів. Якщо це єдина помилка, про яку повідомляє icw_hardware команда, перезапуск ICW повинен дозволити їй пройти.
Node A Fault Status Register Status = Success
OK | Node
OK | Embedded Module
OK | Internal Backup Battery Module
Module
        OK | DIMM00
        OK | DIMM01
        OK | DIMM02
        OK | DIMM03
        OK | DIMM04
        OK | DIMM05
        OK | DIMM06
        OK | DIMM07
        OK | DIMM08
        OK | DIMM09
        OK | DIMM10
        OK | DIMM11
        OK | DIMM12
        OK | DIMM13
        OK | DIMM14
        OK | DIMM15
        OK | DIMM16
        OK | DIMM17
        OK | DIMM18
        OK | DIMM19
        OK | DIMM20
        OK | DIMM21
        OK | DIMM22
        OK | DIMM23
OK | I/O Module 0
OK | I/O Module 1
OK | 4-Port Card

Node B Fault Status Register Status = Success
OK | Node
OK | Embedded Module
OK | Internal Backup Battery Module
Module
        OK | DIMM00
        OK | DIMM01
        OK | DIMM02
        OK | DIMM03
        OK | DIMM04
        OK | DIMM05
        OK | DIMM06
        OK | DIMM07
        OK | DIMM08
        OK | DIMM09
        OK | DIMM10
        OK | DIMM11
        OK | DIMM12
        OK | DIMM13
        OK | DIMM14
        OK | DIMM15
        OK | DIMM16
        OK | DIMM17
        OK | DIMM18
        OK | DIMM19
        OK | DIMM20
        OK | DIMM21
        OK | DIMM22
        OK | DIMM23
OK | I/O Module 0
OK | I/O Module 1
OK | 4-Port Card

 

Значення стану в лівому стовпці: OK або FLT. Вони зчитуються з реєстру стану несправностей (FSR).


 Символ "FLT" вказує на те, що FRU прийняв апаратну помилку.


«OK» означає, що для цього FRU не зареєстровано жодної апаратної помилки. Якщо FRU відсутній, статус у цій таблиці має бути "OK". (Порожній слот модуля вводу/виводу буде показаний як «OK» у цих таблицях, але буде вказаний як «Порожній» у таблиці стану FRU вище.)

 


Рекомендовані дії при невдачі:  Зверніться до відповідних статей бази знань, щоб дізнатися більше про те, як вирішити ці проблеми з обладнанням. До них відносяться: 000132703, 000132707 (вузли), 000125540 (модулі вводу/виводу, 4-портова карта) та 000132989 (вбудований модуль). 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

NVRAM Cache Drives
Node Core Counts (NodeA:12, NodeB:12)
Number of NVRAM Drives Required based on Core Count: 2
NVRAM Drives Found (NodeA:2, NodeB:2)
NVMe Storage Drives
Number of NVMe Drives Required: 6
SCM Drives Found (NodeA: 0, NodeB: 0)
SSD Drives Found (NodeA: 12 (NVMe 6, SAS 6), NodeB: 12 (NVMe 6, SAS 6))
NVMe Drive Check = Success
compareNodeDrives - NVEe Drive Counts, NodeA 8, NodeB 8
compareNodeDrives - Both Nodes see same NVMe drives
compareNodeDrives - SAS SSD Drive Counts, NodeA 12, NodeB 12
compareNodeDrives - Both Nodes see same drives
Compare Node Drive Check = Success
checkExpansionEnclosures - nodeAEnclCount 2, nodeBEnclCount 2
Enclosure Check = Success

 

 

Перевірки, пов'язані з приводом, включають:

  1. Пристрій повинен містити правильну кількість дисків кеш-пам'яті NVRAM (конкретна кількість залежить від моделі пристрою). Рекомендовані дії, якщо це покаже збій: Шукайте відсутні, несправні або неправильно встановлені диски NVRAM. Вихід файлу "svc_diag list --nvme_drive" може бути корисною.

 

  1. Накопичувачі даних у системі повинні відповідати офіційним правилам конфігурації для дисків SCM, SCD і SAS (у цьому прикладі в пристрої немає дисків SCM). Рекомендовані дії, якщо це покаже збій: Перевірте мітки дисків усіх дисків NVMe та SAS. Якщо існує суміш типів дисків SCM і SSD, за потреби замініть або вийміть диски.

 

  1. З обох вузлів має бути видно однакову кількість дисків (диск, який видно лише з одного вузла, спричиняє проблеми). Рекомендовані дії, якщо це покаже збій: Ви можете використовувати "svc_diag list --nvme_drive" для відображення детального статусу про диски NVMe, щоб визначити, які диски або диски видно лише на одному вузлі.

 

  1. З обох вузлів має бути видно однакову кількість корпусів дисків (корпус, який видно лише з одного вузла, спричиняє проблеми). Рекомендовані дії, якщо це покаже збій: Перевірте всі кабелі корпусу та переконайтеся, що корпуси правильно підключені до кабелю.
checkIoms - nodeAIoms: [u' 303-321-000C', u' 313-202-000B']
checkIoms - nodeBIoms: [u' 303-321-000C', u' 313-202-000B']
Compare Node IOM Check = Success

 

Модуль вводу/виводу в кожному слоті на одному вузлі повинен збігатися з модулем вводу/виводу в тому ж слоті на одноранговому вузлі.
 

Це може статися, якщо в одному вузлі присутній неправильний тип модуля вводу/виводу. Це також може статися, якщо кожен вузол містить один модуль вводу/виводу, але вони знаходяться в різних слотах (приклад: слот 0 на одному вузлі, але слот 1 на одноранговому вузлі). Ви також можете побачити збій тут, якщо модуль вводу/виводу відсутній або вимкнений (див. розділ «Реєстр стану несправностей» вище).


 

Рекомендовані дії при невдачі:  Порівняйте номери деталей модулів вводу/виводу в обох слотах модулів вводу/виводу на обох вузлах. Якщо є будь-які невідповідності, перемістіть або замініть модулі вводу/виводу, якщо це необхідно, щоб вирішити проблему. KB: Стаття 000125540 також може бути корисною.

OVERALL STATUS: True, return_code 0
IOM Consistency Check : Success
Node Consistency Check : Success
Battery Check : OK
Fault Status Register A : Success
Fault Status Register B : Success
Node A Accessible : True
Node B Accessible : True
Drive Check : Success
Node Drives Compare Check : Success
Enclosure Check : Success
IO Module Compare Check : Success

Цей розділ є стислим викладом інформації, наведеної вище.


Нижче наведено приклад успішного виведення з « svc_diag_list --network" :

Приклад виводу

***** Start minimal cabling check *****
OCP_MEZZ 0 is LINK_STATUS_UP on Node A
OCP_MEZZ 0 is LINK_STATUS_UP on Node B
OCP_MEZZ 1 is LINK_STATUS_UP on Node A
OCP_MEZZ 1 is LINK_STATUS_UP on Node B
***** Minimal cabling check: Overall errors: 0
Overall errors: 0, return code: 0

 

Affected Products

PowerStore
Article Properties
Article Number: 000139935
Article Type: Solution
Last Modified: 29 Jul 2025
Version:  7
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.