PowerStore: Přidání zařízení do stávajícího clusteru selže s chybou "Unconfigured Faulted".

Summary: Během instalace průvodce počáteční konfigurací (ICW) nebo při přidávání zařízení do stávajícího clusteru úloha selže s chybou "Unconfigured Faulted"

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Během počáteční instalace zařízení do nového clusteru nebo při přidávání nového zařízení do stávajícího clusteru mohou selhat kontroly hardwaru a sítě. Toto selhání může změnit stav zařízení z "Unconfigured" na "Unconfigured Faulted". Tento stav znamená, že zařízení se nemůže připojit k novému clusteru nebo ho přidat do existujícího clusteru. Než bude možné zařízení přidat do clusteru, je nutné chybu odstranit.



 

Cause

Chcete-li zjistit, zda existuje problém s hardwarem nebo sítí, který způsobuje stav "Unconfigured Faulted", proveďte následující kroky:

Resolution

Pokud přidáváte zařízení do stávajícího clusteru (z nástroje PowerStore Manager):

  1. Přístup k systému použijte pomocí metody přístupu k servisnímu portu LAN (viz článek PowerStore: Podrobnosti naleznete v přístupu k uzlu).
  2. Po přihlášení ke kontejneru služby jako servisní uživatel spusťte následující skript služby, abyste zjistili, zda se jedná o problém s hardwarem nebo sítí: 
    svc_diag list --icw_hardware
    svc_diag list --network

     

  3. Pokud nejsou hlášeny žádné chyby nebo problémy, je možné, že původní příznaky, které se objevily během operace ICW nebo přidání zařízení, byly přechodné.
     
  4. Pokud se zobrazí chyba nebo problém a vy nemůžete určit, jak problém vyřešit, spusťte následující skript, který vytvoří shromáždění dat, a požádejte o pomoc poskytovatele služeb: 
    svc_dc run
     
  5. Pokud instalujete zařízení do nového clusteru a jste připraveni zopakovat instalaci:
    • Zavřete nástroj Discovery Tool nebo prohlížeč. 
    • Znovu spusťte nástroj Discovery Tool nebo otevřete prohlížeč se statickou servisní IP adresou LAN uzlu A [např. 128.221.1.252].
    • Pokud systém zobrazuje, že je ve stavu "Unconfigured", pokračujte v původní konfiguraci / krocích ICW
    • Opakujte operaci Add Appliance a zkontrolujte, zda je úloha úspěšná.
       
  6. V případě, že úloha stále selže, proveďte sběr dat, abyste získali příslušné protokoly, a požádejte o pomoc poskytovatele služeb.

 

 

Následuje příklad úspěšného výstupu z "  svc_diag list --icw_hardware " v levém sloupci; Pravý sloupec obsahuje vysvětlení chyb, které se mohou zobrazit.

Ukázkový výstup

Popis

hw_type Warnado-EX
Running on Node A

 

Node A FRU Status

OK | Peer Node | 0x0f80
OK | Local Node | 0x1480
OK | Embedded Module | 0x8b81
OK | 4-Port Card | 0x8b81
OK | I/O Module 0 | 0x8b81
OK | I/O Module 1 | 0x8b81
OK | Internal Backup Battery Module | 0x3380

Node B FRU Status
OK | Peer Node | 0x0f80
OK | Local Node | 0x1580
OK | Embedded Module | 0x8b81
OK | 4-Port Card | 0x8b81
OK | I/O Module 0 | 0x8b81
OK | I/O Module 1 | 0x8b81
OK | Internal Backup Battery Module | 0x1380

Tyto tabulky se skládají ze tří sloupců:

 Shrnutí | Název jednotky vyměnitelné v terénu (FRU) | Hodnota snímače stavu


 Sloupec Souhrn vlevo by měl být přečten takto:

OK = stav FRU je dobrý.


Empty = FRU chybí a/nebo zařízení nezjistilo. Vzhledem k tomu, že moduly I/O jsou volitelné, může se u modulů I/O běžně zobrazovat stav "Empty". (V takovém případě musí být stejné sloty pro moduly I/O na obou uzlech prázdné.) Všechny ostatní jednotky FRU jsou povinným hardwarem a měly by být vždy v pořádku.


Off = jednotka FRU je vypnutá. FRU může být nutné vyměnit.


Unknown = Hodnota Status Sensor obsahuje neočekávané hodnoty. FRU může být nutné vyměnit.



 Doporučená akce při selhání:  Podrobnosti o řešení těchto hardwarových problémů naleznete v souvisejících článcích KB. Patří sem: 000132703, 000132707 (uzly), 000125540 (moduly I/O, 4portová karta) a 000132989 (integrovaný modul).

IO Module Consistency Check = Success
Node Consistency Check = Success
Battery Check = OK

 

Tyto kontroly porovnávají souhrnné hodnoty stavu FRU z každého uzlu. Očekává se, že oba uzly budou pro každou FRU hlásit stejnou souhrnnou hodnotu.

 

Doporučená akce při selhání:

  1. Informace o modulech I/O naleznete v článku znalostní databáze 000125540.
  2. Informace o uzlech naleznete v článcích znalostní báze 000132703 a 000132707.
  3. Kontrola modulu interní záložní baterie je v pořádku, pokud nelze přečíst stav FRU z jednoho nebo obou uzlů. Pokud se jedná o jediné selhání nahlášené icw_hardware by restartování ICW mělo umožnit jeho průchod.
Node A Fault Status Register Status = Success
OK | Node
OK | Embedded Module
OK | Internal Backup Battery Module
Module
        OK | DIMM00
        OK | DIMM01
        OK | DIMM02
        OK | DIMM03
        OK | DIMM04
        OK | DIMM05
        OK | DIMM06
        OK | DIMM07
        OK | DIMM08
        OK | DIMM09
        OK | DIMM10
        OK | DIMM11
        OK | DIMM12
        OK | DIMM13
        OK | DIMM14
        OK | DIMM15
        OK | DIMM16
        OK | DIMM17
        OK | DIMM18
        OK | DIMM19
        OK | DIMM20
        OK | DIMM21
        OK | DIMM22
        OK | DIMM23
OK | I/O Module 0
OK | I/O Module 1
OK | 4-Port Card

Node B Fault Status Register Status = Success
OK | Node
OK | Embedded Module
OK | Internal Backup Battery Module
Module
        OK | DIMM00
        OK | DIMM01
        OK | DIMM02
        OK | DIMM03
        OK | DIMM04
        OK | DIMM05
        OK | DIMM06
        OK | DIMM07
        OK | DIMM08
        OK | DIMM09
        OK | DIMM10
        OK | DIMM11
        OK | DIMM12
        OK | DIMM13
        OK | DIMM14
        OK | DIMM15
        OK | DIMM16
        OK | DIMM17
        OK | DIMM18
        OK | DIMM19
        OK | DIMM20
        OK | DIMM21
        OK | DIMM22
        OK | DIMM23
OK | I/O Module 0
OK | I/O Module 1
OK | 4-Port Card

 

Stavové hodnoty v levém sloupci jsou OK nebo FLT. Ty se načítají z registru stavu poruch (FSR).


 Zkratka "FLT" označuje, že jednotka FRU provedla hardwarovou chybu.


"OK" znamená, že pro danou FRU nebyla zaznamenána žádná hardwarová chyba. Pokud jednotka FRU není přítomna, stav v této tabulce by měl být "OK". (Prázdný slot pro modul I/O se v těchto tabulkách zobrazuje jako "OK", ale ve výše uvedené tabulce stavu FRU je uveden jako "prázdný".)

 


Doporučená akce při selhání:  Podrobnosti o řešení těchto hardwarových problémů naleznete v souvisejících článcích KB. Patří sem: 000132703, 000132707 (uzly), 000125540 (moduly I/O, 4portová karta) a 000132989 (integrovaný modul). 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

NVRAM Cache Drives
Node Core Counts (NodeA:12, NodeB:12)
Number of NVRAM Drives Required based on Core Count: 2
NVRAM Drives Found (NodeA:2, NodeB:2)
NVMe Storage Drives
Number of NVMe Drives Required: 6
SCM Drives Found (NodeA: 0, NodeB: 0)
SSD Drives Found (NodeA: 12 (NVMe 6, SAS 6), NodeB: 12 (NVMe 6, SAS 6))
NVMe Drive Check = Success
compareNodeDrives - NVEe Drive Counts, NodeA 8, NodeB 8
compareNodeDrives - Both Nodes see same NVMe drives
compareNodeDrives - SAS SSD Drive Counts, NodeA 12, NodeB 12
compareNodeDrives - Both Nodes see same drives
Compare Node Drive Check = Success
checkExpansionEnclosures - nodeAEnclCount 2, nodeBEnclCount 2
Enclosure Check = Success

 

 

Kontroly související s jednotkou zahrnují:

  1. Zařízení musí obsahovat správný počet jednotek cache NVRAM (konkrétní počet závisí na modelu zařízení). Doporučená akce, pokud se zobrazí selhání: Hledejte chybějící, vadné nebo nesprávně usazené disky NVRAM. Výstupem příkazu "svc_diag list --nvme_drive" může být užitečný.

 

  1. Datové jednotky v systému musí dodržovat oficiální pravidla konfigurace pro jednotky SCM, SCD a SAS (v tomto příkladu nejsou v zařízení žádné disky SCM). Doporučená akce, pokud se zobrazí selhání: Zkontrolujte štítky všech disků NVMe a SAS. Pokud používáte různé typy disků SCM a SSD, disky podle potřeby vyměňte nebo demontujte.

 

  1. Z obou uzlů musí být viditelný stejný počet disků (disk, který je viditelný pouze z jednoho uzlu, způsobuje problémy). Doporučená akce, pokud se zobrazí selhání: Můžete použít "svc_diag list --nvme_drive" zobrazíte podrobný stav disků NVMe, abyste zjistili, které jednotky jsou viditelné pouze na jednom uzlu.

 

  1. Z obou uzlů musí být viditelný stejný počet skříní disků (skříň, která je viditelná pouze z jednoho uzlu, způsobuje problémy). Doporučená akce, pokud se zobrazí selhání: Zkontrolujte všechny kabely skříně a ověřte, zda jsou skříně správně zapojeny.
checkIoms - nodeAIoms: [u' 303-321-000C', u' 313-202-000B']
checkIoms - nodeBIoms: [u' 303-321-000C', u' 313-202-000B']
Compare Node IOM Check = Success

 

Modul I/O v každém slotu na jednom uzlu se musí shodovat s modulem I/O ve stejném slotu na partnerském uzlu.
 

K tomu může dojít, pokud je v jednom uzlu přítomen nesprávný typ modulu I/O. Může k tomu také dojít, pokud každý uzel obsahuje jeden modul I/O, ale ty jsou v různých slotech (například slot 0 na jednom uzlu, ale slot 1 na partnerském uzlu). Poruchu zde uvidíte také v případě, že modul I/O chybí nebo je vypnutý (viz část "Registr stavu poruch" výše).


 

Doporučená akce při selhání:  Porovnejte čísla dílů modulů I/O v obou slotech pro moduly I/O na obou uzlech. Pokud se vyskytnou nějaké nesrovnalosti, přesuňte nebo vyměňte moduly I/O podle potřeby za účelem vyřešení problému. Užitečný může být také článek 000125540 znalostní databáze.

OVERALL STATUS: True, return_code 0
IOM Consistency Check : Success
Node Consistency Check : Success
Battery Check : OK
Fault Status Register A : Success
Fault Status Register B : Success
Node A Accessible : True
Node B Accessible : True
Drive Check : Success
Node Drives Compare Check : Success
Enclosure Check : Success
IO Module Compare Check : Success

Tato část je souhrnem výše uvedených informací.


Následuje příklad úspěšného výstupu z " svc_diag_list --network" :

Ukázkový výstup

***** Start minimal cabling check *****
OCP_MEZZ 0 is LINK_STATUS_UP on Node A
OCP_MEZZ 0 is LINK_STATUS_UP on Node B
OCP_MEZZ 1 is LINK_STATUS_UP on Node A
OCP_MEZZ 1 is LINK_STATUS_UP on Node B
***** Minimal cabling check: Overall errors: 0
Overall errors: 0, return code: 0

 

Affected Products

PowerStore
Article Properties
Article Number: 000139935
Article Type: Solution
Last Modified: 29 Jul 2025
Version:  7
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.