新しいクラスターへのアプライアンスの初期インストール時、または既存のクラスターへの新しいアプライアンスの追加時に、ハードウェアとネットワークのチェックが失敗する可能性があります。この障害により、アプライアンスのステータスが「Unconfigured」から「Unconfigured Faulted」に変更される場合があります。この状態は、アプライアンスを新しいクラスターに参加させたり、既存のクラスターに追加したりできないことを意味します。アプライアンスをクラスターに追加する前に、障害をクリアする必要があります。
「Unconfigured Faulted」状態の原因となっているハードウェアまたはネットワークの問題があるかどうかを判断するには、次の手順を実行します。
アプライアンスを既存のクラスターに追加する場合(PowerStore Managerから):
- サービスLANポート アクセス方法を使用してシステムにアクセスします(「 PowerStore: ノードへのアクセスを参照してください)。
- サービス ユーザーとしてサービス コンテナにログインしたら、次のサービス スクリプトを実行して、ハードウェアまたはネットワークの問題があるかどうかを判断します。
svc_diag list --icw_hardware
svc_diag list --network
- エラーや問題が報告されない場合は、ICWまたはアプライアンスの追加操作中に発生した元の症状が一時的なものであった可能性があります。
- エラーまたは問題が示されていて、解決方法を判断できない場合は、次のスクリプトを実行してデータ コレクションを生成し、サービス プロバイダーに連絡してサポートを受けてください。
svc_dc run
- アプライアンスを新しいクラスターにインストールし、インストールを再試行する準備ができている場合は、次の手順を実行します。
- 検出ツールおよび/またはブラウザーを閉じます。
- 検出ツールを再起動するか、ノードAの静的サービスLAN IPアドレス(例:128.221.1.252)を使用してブラウザーを開きます。
- システムに「未構成」状態と表示された場合は、初期構成/ICW手順を再開します
- アプライアンスの追加操作を再試行して、タスクが成功したかどうかを確認します。
- それでもタスクが失敗する場合は、データ収集を実行して関連するログを取得し、サービス プロバイダーにお問い合わせください。
以下は、「 svc_diag list --icw_hardware 左の列に」があります。右側の列には、表示される可能性のあるエラーの説明が含まれています。
|
出力例 |
説明 |
hw_type Warnado-EX
Running on Node A
|
|
Node A FRU Status
OK | Peer Node | 0x0f80
OK | Local Node | 0x1480
OK | Embedded Module | 0x8b81
OK | 4-Port Card | 0x8b81
OK | I/O Module 0 | 0x8b81
OK | I/O Module 1 | 0x8b81
OK | Internal Backup Battery Module | 0x3380
Node B FRU Status
OK | Peer Node | 0x0f80
OK | Local Node | 0x1580
OK | Embedded Module | 0x8b81
OK | 4-Port Card | 0x8b81
OK | I/O Module 0 | 0x8b81
OK | I/O Module 1 | 0x8b81
OK | Internal Backup Battery Module | 0x1380
|
これらのテーブルは、次の 3 つの列で構成されています。
概要 |フィールド交換可能ユニット(FRU)名 |ステータス センサーの値
左側の [Summary ]列は、次のように読み取れます。
OK = FRUステータスは良好です。
空 = FRUがないか、アプライアンスによって検出されません。I/Oモジュールはオプションであるため、I/Oモジュールのステータスが[Empty]になるのは正常です。(その場合は、両方のノードで同じI/Oモジュール スロットを空にする必要があります)。他のすべてのFRUは必須のハードウェアであり、常に「OK」である必要があります。
消灯 = FRUの電源がオフ。FRUの交換が必要な場合があります。
不明 = ステータス センサーの値に予期しない値が含まれています。FRUの交換が必要な場合があります。
障害に対する推奨処置: これらのハードウェアの問題を解決する方法の詳細については、関連するKB記事を参照してください。例えば次のような場合です。000132703、 000132707(ノード)、 000125540(I/Oモジュール、4ポート カード)、 000132989(組み込みモジュール)。
|
IO Module Consistency Check = Success
Node Consistency Check = Success
Battery Check = OK
|
これらのチェックでは、各ノードのFRUステータス サマリーの値を比較します。両方のノードで、各FRUに対して同じサマリー値がレポートされます。
障害に対する推奨処置:
- I/Oモジュールについては、KB記事 000125540を参照してください。
- ノードについては、KB記事 000132703および 000132707を参照してください。
- 一方または両方のノードからFRUステータスを読み取れない場合を除き、内蔵バックアップ バッテリー モジュールのチェックはOKです。これが、
icw_hardware コマンドを実行し、ICWを再起動すると合格するはずです。
|
Node A Fault Status Register Status = Success
OK | Node
OK | Embedded Module
OK | Internal Backup Battery Module
Module
OK | DIMM00
OK | DIMM01
OK | DIMM02
OK | DIMM03
OK | DIMM04
OK | DIMM05
OK | DIMM06
OK | DIMM07
OK | DIMM08
OK | DIMM09
OK | DIMM10
OK | DIMM11
OK | DIMM12
OK | DIMM13
OK | DIMM14
OK | DIMM15
OK | DIMM16
OK | DIMM17
OK | DIMM18
OK | DIMM19
OK | DIMM20
OK | DIMM21
OK | DIMM22
OK | DIMM23
OK | I/O Module 0
OK | I/O Module 1
OK | 4-Port Card
Node B Fault Status Register Status = Success
OK | Node
OK | Embedded Module
OK | Internal Backup Battery Module
Module
OK | DIMM00
OK | DIMM01
OK | DIMM02
OK | DIMM03
OK | DIMM04
OK | DIMM05
OK | DIMM06
OK | DIMM07
OK | DIMM08
OK | DIMM09
OK | DIMM10
OK | DIMM11
OK | DIMM12
OK | DIMM13
OK | DIMM14
OK | DIMM15
OK | DIMM16
OK | DIMM17
OK | DIMM18
OK | DIMM19
OK | DIMM20
OK | DIMM21
OK | DIMM22
OK | DIMM23
OK | I/O Module 0
OK | I/O Module 1
OK | 4-Port Card
|
左の列のステータス値は OK または FLT です。これらはフォルト・ステータス・レジスタ(FSR)から読み取られます。
「FLT」は、FRUでハードウェア エラーが発生したことを示します。
「OK」は、そのFRUに対してハードウェア エラーが記録されていないことを意味します。FRUがない場合、この表のステータスは[OK]になります。(これらの表では空のI/Oモジュール スロットは「OK」と表示されますが、上記のFRUステータス表では「空」と表示されます)。
障害に対する推奨処置: これらのハードウェアの問題を解決する方法の詳細については、関連するKB記事を参照してください。例えば次のような場合です。000132703、 000132707(ノード)、 000125540(I/Oモジュール、4ポート カード)、 000132989 (組み込みモジュール)。
|
NVRAM Cache Drives
Node Core Counts (NodeA:12, NodeB:12)
Number of NVRAM Drives Required based on Core Count: 2
NVRAM Drives Found (NodeA:2, NodeB:2)
NVMe Storage Drives
Number of NVMe Drives Required: 6
SCM Drives Found (NodeA: 0, NodeB: 0)
SSD Drives Found (NodeA: 12 (NVMe 6, SAS 6), NodeB: 12 (NVMe 6, SAS 6))
NVMe Drive Check = Success
compareNodeDrives - NVEe Drive Counts, NodeA 8, NodeB 8
compareNodeDrives - Both Nodes see same NVMe drives
compareNodeDrives - SAS SSD Drive Counts, NodeA 12, NodeB 12
compareNodeDrives - Both Nodes see same drives
Compare Node Drive Check = Success
checkExpansionEnclosures - nodeAEnclCount 2, nodeBEnclCount 2
Enclosure Check = Success
|
ドライブ関連のチェックは次のとおりです。
- アプライアンスには、正しい数のNVRAMキャッシュ ドライブが含まれている必要があります(具体的な数はアプライアンスのモデルによって異なります)。障害が発生した場合の推奨処置: NVRAMドライブの欠落、障害、または正しく装着されていないNVRAMドライブを探します。出力された
"svc_diag list --nvme_driveコマンドが役に立つ場合があります。
- システム内のデータ ドライブは、SCM、SCD、SASドライブの公式構成ルールに従う必要があります(この例では、アプライアンスにSCMドライブはありません)。障害が発生した場合の推奨処置: すべてのNVMeおよびSASドライブのドライブ ラベルを確認します。SCMドライブ タイプとSSDドライブ タイプが混在している場合は、必要に応じてドライブを交換または取り外します。
- 両方のノードから認識できるドライブの数が同じである必要があります(1つのノードからしか認識されないドライブは問題を引き起こします)。障害が発生した場合の推奨処置: 「
svc_diag list --nvme_drive" NVMeドライブに関する詳細なステータスを表示して、1つのノードにのみ表示されるドライブを特定します。
- 両方のノードから認識できるドライブ エンクロージャの数が同じである必要があります(1つのノードからしか認識されないエンクロージャは問題を引き起こします)。障害が発生した場合の推奨処置: すべてのエンクロージャ ケーブルを確認し、エンクロージャが正しくケーブル接続されていることを確認します。
|
checkIoms - nodeAIoms: [u' 303-321-000C', u' 313-202-000B']
checkIoms - nodeBIoms: [u' 303-321-000C', u' 313-202-000B']
Compare Node IOM Check = Success
|
1つのノードの各スロットのI/Oモジュールは、ピア ノードの同じスロットのI/Oモジュールと一致する必要があります。
これは、間違ったタイプのI/Oモジュールが1つのノードに存在する場合に発生する可能性があります。また、各ノードにI/Oモジュールが1つ含まれていても、それらが異なるスロットに配置されている場合(たとえば、1つのノードにはスロット0があるが、ピア ノードにはスロット1があるなど)にも発生する可能性があります。また、I/Oモジュールが見つからないか、電源がオフになっている場合にも、ここで障害を確認できます(上記の「フォルトステータスレジスタ」セクションを参照)。
障害に対する推奨処置: 両方のノード上の両方のI/Oモジュール スロットのI/Oモジュールのパーツ ナンバーを比較します。不整合がある場合は、必要に応じてI/Oモジュールを移動または交換して問題を修正します。KB記事 000125540も役に立つ場合があります。 |
OVERALL STATUS: True, return_code 0
IOM Consistency Check : Success
Node Consistency Check : Success
Battery Check : OK
Fault Status Register A : Success
Fault Status Register B : Success
Node A Accessible : True
Node B Accessible : True
Drive Check : Success
Node Drives Compare Check : Success
Enclosure Check : Success
IO Module Compare Check : Success
|
このセクションでは、上記の情報の概要について説明します。 |
以下は、「 svc_diag_list --network" )をリロードするには、次を実行します。
|
出力例 |
***** Start minimal cabling check *****
OCP_MEZZ 0 is LINK_STATUS_UP on Node A
OCP_MEZZ 0 is LINK_STATUS_UP on Node B
OCP_MEZZ 1 is LINK_STATUS_UP on Node A
OCP_MEZZ 1 is LINK_STATUS_UP on Node B
***** Minimal cabling check: Overall errors: 0
Overall errors: 0, return code: 0
|