PowerStore: 기존 클러스터에 어플라이언스를 추가할 수 없고 "Unconfigured Faulted"가 표시됩니다.

Summary: ICW(Initial Configuration Wizard)를 설치하는 동안 또는 기존 클러스터에 어플라이언스를 추가할 때 작업이 실패하고 "Unconfigured Faulted"가 표시됩니다.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

새 클러스터에 어플라이언스를 처음 설치하거나 기존 클러스터에 새 어플라이언스를 추가할 때 하드웨어 및 네트워크 검사가 실패할 수 있습니다. 이 장애로 인해 어플라이언스의 상태가 "구성되지 않음"에서 "구성되지 않은 결함"으로 변경될 수 있습니다. 이 상태는 어플라이언스를 새 클러스터에 연결하거나 기존 클러스터에 추가할 수 없음을 의미합니다. 어플라이언스를 클러스터에 추가하기 전에 장애를 지워야 합니다.



 

Cause

"Unconfigured Faulted" 상태를 일으키는 하드웨어 또는 네트워크 문제가 있는지 확인하려면 다음 단계를 수행하십시오.

Resolution

기존 클러스터에 어플라이언스를 추가하는 경우(PowerStore Manager에서):

  1. 서비스 LAN 포트 액세스 방법을 사용하여 시스템에 액세스합니다( PowerStore: 자세한 내용은 노드 액세스를 참조하십시오).
  2. 서비스 컨테이너에 서비스 사용자로 로그인한 후 다음 서비스 스크립트를 실행하여 하드웨어 또는 네트워크 문제가 있는지 확인합니다. 
    svc_diag list --icw_hardware
    svc_diag list --network

     

  3. 오류나 문제가 보고되지 않으면 ICW 또는 어플라이언스 추가 작업 중에 나타나는 원래 증상이 일시적인 것일 수 있습니다.
     
  4. 오류 또는 문제가 나타나고 해결 방법을 알 수 없는 경우 다음 스크립트를 실행하여 데이터 수집을 생성하고 서비스 공급업체에 문의하여 지원을 요청하십시오. 
    svc_dc run
     
  5. 새 클러스터에 어플라이언스를 설치하고 설치를 다시 시도할 준비가 된 경우:
    • 검색 툴 및/또는 브라우저를 닫습니다. 
    • 검색 툴을 다시 시작하거나 노드 A의 정적 서비스 LAN IP 주소[예: 128.221.1.252]를 사용하여 브라우저를 엽니다.
    • 시스템에 '구성되지 않음' 상태가 표시되면 초기 구성/ICW 단계를 재개합니다.
    • 어플라이언스 추가 작업을 다시 시도하여 작업이 성공하는지 확인합니다.
       
  6. 작업이 계속 실패하는 경우 데이터 수집을 수행하여 관련 로그를 얻고 서비스 공급업체에 지원을 요청하십시오.

 

 

다음은 에서 성공적인 출력의 예입니다.  svc_diag list --icw_hardware " 왼쪽 열에서; 오른쪽 열에는 표시될 수 있는 오류에 대한 설명이 포함되어 있습니다.

샘플 출력

설명

hw_type Warnado-EX
Running on Node A

 

Node A FRU Status

OK | Peer Node | 0x0f80
OK | Local Node | 0x1480
OK | Embedded Module | 0x8b81
OK | 4-Port Card | 0x8b81
OK | I/O Module 0 | 0x8b81
OK | I/O Module 1 | 0x8b81
OK | Internal Backup Battery Module | 0x3380

Node B FRU Status
OK | Peer Node | 0x0f80
OK | Local Node | 0x1580
OK | Embedded Module | 0x8b81
OK | 4-Port Card | 0x8b81
OK | I/O Module 0 | 0x8b81
OK | I/O Module 1 | 0x8b81
OK | Internal Backup Battery Module | 0x1380

이러한 표는 세 개의 열로 구성됩니다.

 요약 | FRU(Field-Replaceable Unit) 이름 | 상태 센서 값


 왼쪽의 요약 열은 다음과 같이 읽어야 합니다.

OK = FRU 상태가 양호합니다.


비어 있음 = FRU가 누락되었거나 어플라이언스에서 감지되지 않습니다. I/O 모듈은 선택 사항이므로 I/O 모듈의 상태가 "비어 있음"으로 표시되는 것은 정상일 수 있습니다. (이 경우 두 노드 모두에서 동일한 I/O 모듈 슬롯이 비어 있어야 합니다.) 다른 모든 FRU는 필수 하드웨어이며 항상 "OK" 상태여야 합니다.


꺼짐 = FRU 전원이 꺼져 있습니다. FRU를 교체해야 할 수 있습니다.


알 수 없음 = 상태 센서 값에 예기치 않은 값이 있습니다. FRU를 교체해야 할 수 있습니다.



 실패에 대한 권장 조치:  이러한 하드웨어 문제를 해결하는 방법에 대한 자세한 내용은 관련 KB 문서를 참조하십시오. 여기에는 다음이 포함됩니다. 000132703, 000132707(노드), 000125540(I/O 모듈, 4포트 카드) 및 000132989(내장 모듈)

IO Module Consistency Check = Success
Node Consistency Check = Success
Battery Check = OK

 

이러한 검사는 각 노드의 FRU 상태 요약 값을 비교합니다. 두 노드 모두 각 FRU에 대해 동일한 요약 값을 보고해야 합니다.

 

실패에 대한 권장 조치:

  1. I/O 모듈에 대한 자세한 내용은 KB 문서 000125540를 참조하십시오.
  2. 노드의 경우 KB 문서 000132703000132707를 참조하십시오.
  3. 하나 또는 두 노드 모두에서 FRU 상태를 읽을 수 없는 경우를 제외하고 내부 백업 배터리 모듈 검사는 정상입니다. 이것이 에서 보고된 유일한 오류인 경우 icw_hardware 명령을 사용하여 ICW를 다시 시작하면 통과할 수 있습니다.
Node A Fault Status Register Status = Success
OK | Node
OK | Embedded Module
OK | Internal Backup Battery Module
Module
        OK | DIMM00
        OK | DIMM01
        OK | DIMM02
        OK | DIMM03
        OK | DIMM04
        OK | DIMM05
        OK | DIMM06
        OK | DIMM07
        OK | DIMM08
        OK | DIMM09
        OK | DIMM10
        OK | DIMM11
        OK | DIMM12
        OK | DIMM13
        OK | DIMM14
        OK | DIMM15
        OK | DIMM16
        OK | DIMM17
        OK | DIMM18
        OK | DIMM19
        OK | DIMM20
        OK | DIMM21
        OK | DIMM22
        OK | DIMM23
OK | I/O Module 0
OK | I/O Module 1
OK | 4-Port Card

Node B Fault Status Register Status = Success
OK | Node
OK | Embedded Module
OK | Internal Backup Battery Module
Module
        OK | DIMM00
        OK | DIMM01
        OK | DIMM02
        OK | DIMM03
        OK | DIMM04
        OK | DIMM05
        OK | DIMM06
        OK | DIMM07
        OK | DIMM08
        OK | DIMM09
        OK | DIMM10
        OK | DIMM11
        OK | DIMM12
        OK | DIMM13
        OK | DIMM14
        OK | DIMM15
        OK | DIMM16
        OK | DIMM17
        OK | DIMM18
        OK | DIMM19
        OK | DIMM20
        OK | DIMM21
        OK | DIMM22
        OK | DIMM23
OK | I/O Module 0
OK | I/O Module 1
OK | 4-Port Card

 

왼쪽 열의 상태 값은 OK 또는 FLT입니다. FSR(Fault Status Register)에서 읽습니다.


 "FLT"는 FRU에 하드웨어 오류가 발생했음을 나타냅니다.


"OK"는 해당 FRU에 대해 기록된 하드웨어 오류가 없음을 의미합니다. FRU가 없는 경우 이 표에 "OK" 상태가 표시되어야 합니다. (빈 I/O 모듈 슬롯은 이러한 표에서 "OK"로 표시되지만 위의 FRU 상태 표에서는 "비어 있음"으로 나열됩니다.)

 


실패에 대한 권장 조치:  이러한 하드웨어 문제를 해결하는 방법에 대한 자세한 내용은 관련 KB 문서를 참조하십시오. 여기에는 다음이 포함됩니다. 000132703, 000132707(노드), 000125540(I/O 모듈, 4포트 카드) 및 000132989 (내장 모듈) 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

NVRAM Cache Drives
Node Core Counts (NodeA:12, NodeB:12)
Number of NVRAM Drives Required based on Core Count: 2
NVRAM Drives Found (NodeA:2, NodeB:2)
NVMe Storage Drives
Number of NVMe Drives Required: 6
SCM Drives Found (NodeA: 0, NodeB: 0)
SSD Drives Found (NodeA: 12 (NVMe 6, SAS 6), NodeB: 12 (NVMe 6, SAS 6))
NVMe Drive Check = Success
compareNodeDrives - NVEe Drive Counts, NodeA 8, NodeB 8
compareNodeDrives - Both Nodes see same NVMe drives
compareNodeDrives - SAS SSD Drive Counts, NodeA 12, NodeB 12
compareNodeDrives - Both Nodes see same drives
Compare Node Drive Check = Success
checkExpansionEnclosures - nodeAEnclCount 2, nodeBEnclCount 2
Enclosure Check = Success

 

 

드라이브 관련 검사에는 다음이 포함됩니다.

  1. 어플라이언스에는 올바른 수의 NVRAM 캐시 드라이브가 포함되어야 합니다(구체적인 수는 어플라이언스 모델에 따라 다름). 실패가 표시되는 경우 권장되는 작업: 누락, 장애 또는 잘못 장착된 NVRAM 드라이브를 찾습니다. 의 출력 "svc_diag list --nvme_drive" 명령이 도움이 될 수 있습니다.

 

  1. 시스템의 데이터 드라이브는 SCM, SCD 및 SAS 드라이브에 대한 공식 구성 규칙을 따라야 합니다(이 예에서는 어플라이언스에 SCM 드라이브가 없음). 실패가 표시되는 경우 권장되는 작업: 모든 NVMe 및 SAS 드라이브의 드라이브 레이블을 확인합니다. SCM 및 SSD 드라이브 유형이 혼합된 경우 필요에 따라 드라이브를 교체하거나 제거합니다.

 

  1. 두 노드 모두에서 동일한 수의 드라이브를 볼 수 있어야 합니다(한 노드에서만 볼 수 있는 드라이브가 문제를 일으킴). 실패가 표시되는 경우 권장되는 작업: "를 사용할 수 있습니다.svc_diag list --nvme_drive" 을 클릭하여 NVMe 드라이브에 대한 자세한 상태를 표시하여 한 노드에만 표시되는 드라이브를 식별합니다.

 

  1. 두 노드 모두에서 동일한 수의 드라이브 인클로저를 볼 수 있어야 합니다(한 노드에서만 볼 수 있는 인클로저가 문제를 일으킴). 실패가 표시되는 경우 권장되는 작업: 모든 인클로저 케이블을 확인하고 인클로저에 케이블이 제대로 연결되어 있는지 확인합니다.
checkIoms - nodeAIoms: [u' 303-321-000C', u' 313-202-000B']
checkIoms - nodeBIoms: [u' 303-321-000C', u' 313-202-000B']
Compare Node IOM Check = Success

 

한 노드의 각 슬롯에 있는 I/O 모듈은 피어 노드의 동일한 슬롯에 있는 I/O 모듈과 일치해야 합니다.
 

이는 한 노드에 잘못된 유형의 I/O 모듈이 있는 경우 발생할 수 있습니다. 각 노드에 I/O 모듈이 하나씩 포함되어 있지만 서로 다른 슬롯에 있는 경우에도 발생할 수 있습니다(예: 한 노드에는 슬롯 0이지만 피어 노드에는 슬롯 1). I/O 모듈이 누락되었거나 전원이 꺼져 있는 경우에도 여기에서 오류를 확인할 수 있습니다(위의 "장애 상태 레지스터" 섹션 참조).


 

실패에 대한 권장 조치:  두 노드의 두 I/O 모듈 슬롯에 있는 I/O 모듈의 파트 번호를 비교합니다. 불일치하는 경우 필요에 따라 I/O 모듈을 이동하거나 교체하여 문제를 해결합니다. KB 문서 000125540도 도움이 될 수 있습니다.

OVERALL STATUS: True, return_code 0
IOM Consistency Check : Success
Node Consistency Check : Success
Battery Check : OK
Fault Status Register A : Success
Fault Status Register B : Success
Node A Accessible : True
Node B Accessible : True
Drive Check : Success
Node Drives Compare Check : Success
Enclosure Check : Success
IO Module Compare Check : Success

이 섹션은 위에 제공된 정보를 요약한 것입니다.


다음은 에서 성공적인 출력의 예입니다. svc_diag_list --network" 을 엽니다.

샘플 출력

***** Start minimal cabling check *****
OCP_MEZZ 0 is LINK_STATUS_UP on Node A
OCP_MEZZ 0 is LINK_STATUS_UP on Node B
OCP_MEZZ 1 is LINK_STATUS_UP on Node A
OCP_MEZZ 1 is LINK_STATUS_UP on Node B
***** Minimal cabling check: Overall errors: 0
Overall errors: 0, return code: 0

 

Affected Products

PowerStore
Article Properties
Article Number: 000139935
Article Type: Solution
Last Modified: 29 Jul 2025
Version:  7
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.