PowerStore: Dodanie urządzenia do istniejącego klastra kończy się niepowodzeniem z komunikatem "Unconfigured Faulted".

Summary: Podczas instalacji Kreatora wstępnej konfiguracji (ICW) lub podczas dodawania urządzenia do istniejącego klastra zadanie kończy się niepowodzeniem i wyświetla komunikat o błędzie "Unconfigured Faulted" ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Podczas początkowej instalacji urządzenia w nowym klastrze lub podczas dodawania nowego urządzenia do istniejącego klastra wykonywane są testy sprzętu i sieci, które mogą zakończyć się niepowodzeniem. Ta awaria może spowodować zmianę stanu urządzenia z "Nieskonfigurowane" na "Nieskonfigurowane z błędem". Ten stan oznacza, że urządzenie nie może dołączyć do nowego klastra ani zostać dodane do istniejącego klastra. Przed dodaniem urządzenia do klastra należy usunąć usterkę.



 

Cause

Aby sprawdzić, czy problem ze sprzętem lub siecią jest przyczyną problemu z nieskonfigurowanym błędem , wykonaj następujące czynności:

Resolution

W przypadku dodawania urządzenia do istniejącego klastra (z poziomu programu PowerStore Manager):

  1. Uzyskaj dostęp do systemu, korzystając z metody dostępu do portu serwisowej sieci LAN (patrz PowerStore: Uzyskiwanie dostępu do węzła w celu uzyskania szczegółowych informacji).
  2. Po zalogowaniu się do kontenera usługi jako użytkownik usługi uruchom następujący skrypt usługi w celu określenia, czy występuje problem ze sprzętem lub siecią: 
    svc_diag list --icw_hardware
    svc_diag list --network

     

  3. Jeśli nie zostaną zgłoszone żadne błędy lub problemy, możliwe, że pierwotne objawy widoczne podczas operacji ICW lub dodawania urządzenia były przejściowe.
     
  4. Jeśli zostanie wskazany błąd lub problem, a użytkownik nie może określić sposobu jego rozwiązania, uruchom następujący skrypt w celu zebrania danych i skontaktuj się z usługodawcą, aby uzyskać pomoc: 
    svc_dc run
     
  5. Jeśli instalujesz urządzenie w nowym klastrze i chcesz ponowić próbę instalacji:
    • Zamknij narzędzie do wykrywania i/lub przeglądarkę. 
    • Uruchom ponownie narzędzie wykrywania lub otwórz przeglądarkę ze statycznym adresem IP usługi LAN dla węzła A [tj. 128.221.1.252].
    • Jeśli system wyświetla komunikat, że jest w stanie nieskonfigurowanym, wznów kroki konfiguracji początkowej / ICW
    • Ponów operację Add Appliance, aby sprawdzić, czy zadanie zakończyło się pomyślnie.
       
  6. Jeśli zadanie nadal kończy się niepowodzeniem, wykonaj zbieranie danych, aby uzyskać odpowiednie dzienniki, a następnie skontaktuj się z usługodawcą w celu uzyskania pomocy.

 

 

Poniżej znajduje się przykład pomyślnego wyniku z "  svc_diag list --icw_hardware " w lewej kolumnie; W prawej kolumnie znajdują się objaśnienia błędów, które mogą się pojawić.

Przykładowe dane wyjściowe

Opis

hw_type Warnado-EX
Running on Node A

 

Node A FRU Status

OK | Peer Node | 0x0f80
OK | Local Node | 0x1480
OK | Embedded Module | 0x8b81
OK | 4-Port Card | 0x8b81
OK | I/O Module 0 | 0x8b81
OK | I/O Module 1 | 0x8b81
OK | Internal Backup Battery Module | 0x3380

Node B FRU Status
OK | Peer Node | 0x0f80
OK | Local Node | 0x1580
OK | Embedded Module | 0x8b81
OK | 4-Port Card | 0x8b81
OK | I/O Module 0 | 0x8b81
OK | I/O Module 1 | 0x8b81
OK | Internal Backup Battery Module | 0x1380

Tabele te składają się z trzech kolumn:

 Podsumowanie | Nazwa modułu wymienianego na miejscu (FRU) | Wartość czujnika stanu


 Kolumnę Podsumowanie po lewej stronie należy odczytywać w następujący sposób:

OK = stan FRU jest dobry.


Pusty = brakuje FRU i/lub nie został wykryty przez urządzenie. Ponieważ moduły we/wy są opcjonalne, status "Pusty" modułów we/wy może być normalny. (W takim przypadku te same gniazda modułów we/wy muszą być puste na obu węzłach). Wszystkie pozostałe FRU są wymaganym sprzętem i zawsze powinny być "OK".


Wyłączony = FRU jest wyłączony. FRU może wymagać wymiany.


Nieznany = Stan Wartość czujnika zawiera nieoczekiwane wartości. FRU może wymagać wymiany.



 Zalecane działanie w przypadku awarii:  Zapoznaj się z powiązanymi artykułami bazy wiedzy, aby uzyskać szczegółowe informacje na temat rozwiązywania tych problemów ze sprzętem. Należą do nich m.in.: 000132703, 000132707 (węzły), 000125540 (moduły we/wy, karta 4-portowa) i 000132989 (moduł wbudowany).

IO Module Consistency Check = Success
Node Consistency Check = Success
Battery Check = OK

 

Te testy porównują wartości podsumowania stanu FRU z każdego węzła. Oczekuje się, że oba węzły będą zgłaszać tę samą wartość podsumowania dla każdego FRU.

 

Zalecane działanie w przypadku awarii:

  1. W przypadku modułów we/wy należy zapoznać się z artykułem 000125540 bazy wiedzy.
  2. W przypadku węzłów zapoznaj się z artykułami bazy wiedzy 000132703 i 000132707.
  3. Sprawdzanie wewnętrznego modułu baterii zapasowej jest prawidłowe, chyba że nie można odczytać stanu FRU z jednego lub obu węzłów. Jeśli jest to jedyna awaria zgłoszona przez icw_hardware polecenie, ponowne uruchomienie ICW powinno pozwolić na jego przejście.
Node A Fault Status Register Status = Success
OK | Node
OK | Embedded Module
OK | Internal Backup Battery Module
Module
        OK | DIMM00
        OK | DIMM01
        OK | DIMM02
        OK | DIMM03
        OK | DIMM04
        OK | DIMM05
        OK | DIMM06
        OK | DIMM07
        OK | DIMM08
        OK | DIMM09
        OK | DIMM10
        OK | DIMM11
        OK | DIMM12
        OK | DIMM13
        OK | DIMM14
        OK | DIMM15
        OK | DIMM16
        OK | DIMM17
        OK | DIMM18
        OK | DIMM19
        OK | DIMM20
        OK | DIMM21
        OK | DIMM22
        OK | DIMM23
OK | I/O Module 0
OK | I/O Module 1
OK | 4-Port Card

Node B Fault Status Register Status = Success
OK | Node
OK | Embedded Module
OK | Internal Backup Battery Module
Module
        OK | DIMM00
        OK | DIMM01
        OK | DIMM02
        OK | DIMM03
        OK | DIMM04
        OK | DIMM05
        OK | DIMM06
        OK | DIMM07
        OK | DIMM08
        OK | DIMM09
        OK | DIMM10
        OK | DIMM11
        OK | DIMM12
        OK | DIMM13
        OK | DIMM14
        OK | DIMM15
        OK | DIMM16
        OK | DIMM17
        OK | DIMM18
        OK | DIMM19
        OK | DIMM20
        OK | DIMM21
        OK | DIMM22
        OK | DIMM23
OK | I/O Module 0
OK | I/O Module 1
OK | 4-Port Card

 

Wartości stanu w lewej kolumnie to OK lub FLT. Są one odczytywane z rejestru stanu awarii (FSR).


 "FLT" oznacza, że w jednostce FRU wystąpił błąd sprzętowy.


Przycisk "OK" oznacza, że dla tego elementu FRU nie zarejestrowano żadnego błędu sprzętowego. Jeśli element FRU nie jest obecny, stan w tej tabeli powinien mieć wartość "OK". (Puste gniazdo modułu we/wy będzie wyświetlane jako "OK" w tych tabelach, ale w tabeli stanu FRU powyżej) będzie oznaczone jako "puste").

 


Zalecane działanie w przypadku awarii:  Zapoznaj się z powiązanymi artykułami bazy wiedzy, aby uzyskać szczegółowe informacje na temat rozwiązywania tych problemów ze sprzętem. Należą do nich m.in.: 000132703, 000132707 (węzły), 000125540 (moduły we/wy, karta 4-portowa) i 000132989 (moduł wbudowany). 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

NVRAM Cache Drives
Node Core Counts (NodeA:12, NodeB:12)
Number of NVRAM Drives Required based on Core Count: 2
NVRAM Drives Found (NodeA:2, NodeB:2)
NVMe Storage Drives
Number of NVMe Drives Required: 6
SCM Drives Found (NodeA: 0, NodeB: 0)
SSD Drives Found (NodeA: 12 (NVMe 6, SAS 6), NodeB: 12 (NVMe 6, SAS 6))
NVMe Drive Check = Success
compareNodeDrives - NVEe Drive Counts, NodeA 8, NodeB 8
compareNodeDrives - Both Nodes see same NVMe drives
compareNodeDrives - SAS SSD Drive Counts, NodeA 12, NodeB 12
compareNodeDrives - Both Nodes see same drives
Compare Node Drive Check = Success
checkExpansionEnclosures - nodeAEnclCount 2, nodeBEnclCount 2
Enclosure Check = Success

 

 

Kontrole związane z dyskiem obejmują:

  1. Urządzenie musi zawierać odpowiednią liczbę dysków pamięci podręcznej NVRAM (konkretna liczba zależy od modelu urządzenia). Zalecane działanie w przypadku wystąpienia błędu: Sprawdź, czy nie ma brakujących, uszkodzonych lub nieprawidłowo osadzonych dysków NVRAM. Dane wyjściowe "svc_diag list --nvme_drive" może być pomocne.

 

  1. Dyski danych w systemie muszą być zgodne z oficjalnymi regułami konfiguracji dysków SCM, SCD i SAS (w tym przykładzie w urządzeniu nie ma dysków SCM). Zalecane działanie w przypadku wystąpienia błędu: Sprawdź etykiety wszystkich dysków NVMe i SAS. Jeśli istnieje kombinacja dysków SCM i SSD, w razie potrzeby wymień lub wyjmij dyski.

 

  1. Ta sama liczba dysków musi być widoczna z obu węzłów (dysk, który jest widoczny tylko z jednego węzła powoduje problemy). Zalecane działanie w przypadku wystąpienia błędu: Możesz użyć "svc_diag list --nvme_drive" , aby wyświetlić szczegółowy stan dysków NVMe w celu zidentyfikowania, które dyski są widoczne tylko w jednym węźle.

 

  1. Ta sama liczba obudów dysków musi być widoczna z obu węzłów (obudowa, która jest widoczna tylko z jednego węzła powoduje problemy). Zalecane działanie w przypadku wystąpienia błędu: Sprawdź wszystkie obudowy i upewnij się, że są one prawidłowo podłączone.
checkIoms - nodeAIoms: [u' 303-321-000C', u' 313-202-000B']
checkIoms - nodeBIoms: [u' 303-321-000C', u' 313-202-000B']
Compare Node IOM Check = Success

 

Moduł we/wy w każdym gnieździe jednego węzła musi być zgodny z modułem we/wy w tym samym gnieździe w węźle równorzędnym.
 

Taka sytuacja może wystąpić, jeśli w jednym węźle znajduje się niewłaściwy typ modułu we/wy. Może się to również zdarzyć, jeśli każdy węzeł zawiera jeden moduł we/wy, ale znajdują się one w różnych gniazdach (przykład: gniazdo 0 w jednym węźle, ale gniazdo 1 w węźle równorzędnym). Awaria w tym miejscu może być również widoczna, jeśli brakuje modułu we/wy lub jest on wyłączony (patrz sekcja "Fault Status Register" powyżej).


 

Zalecane działanie w przypadku awarii:  Porównaj numery części modułów we/wy w obu gniazdach modułów we/wy w obu węzłach. W przypadku niespójności należy odpowiednio przenieść lub wymienić moduły we/wy, aby rozwiązać problem. Pomocny może być również artykuł 000125540 bazy wiedzy.

OVERALL STATUS: True, return_code 0
IOM Consistency Check : Success
Node Consistency Check : Success
Battery Check : OK
Fault Status Register A : Success
Fault Status Register B : Success
Node A Accessible : True
Node B Accessible : True
Drive Check : Success
Node Drives Compare Check : Success
Enclosure Check : Success
IO Module Compare Check : Success

Ta sekcja stanowi podsumowanie informacji podanych powyżej.


Poniżej znajduje się przykład pomyślnego wyniku z " svc_diag_list --network" :

Przykładowe dane wyjściowe

***** Start minimal cabling check *****
OCP_MEZZ 0 is LINK_STATUS_UP on Node A
OCP_MEZZ 0 is LINK_STATUS_UP on Node B
OCP_MEZZ 1 is LINK_STATUS_UP on Node A
OCP_MEZZ 1 is LINK_STATUS_UP on Node B
***** Minimal cabling check: Overall errors: 0
Overall errors: 0, return code: 0

 

Affected Products

PowerStore
Article Properties
Article Number: 000139935
Article Type: Solution
Last Modified: 29 Jul 2025
Version:  7
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.