PowerVault ME5:「The host link PHY error count is greater than the error threshold」メッセージ
Summary: ホストまたはスイッチに接続されているファイバ チャネルまたはSASコントローラーのフロントエンド ポートを使用している場合に、PowerVault Me5オペレーターのイベント履歴ログに、イベント663「host link PHY error count」メッセージが表示されることがあります。 このイベントは、ME5ファームウェア バージョンME5.1.2.1.0以降で導入されました。 ...
Instructions
PowerVault ME5シリーズ コントローラー モジュールの構成に応じて、この記事の該当するセクションに移動してください。
ファイバ チャネル(FC)フロントエンド ポートを使用するコントローラー
ファイバ チャネル(FC) SFPトランシーバーを使用してコントローラー モジュールを接続しているPowerVault ME5シリーズ アレイのオペレーターは、この症状を解決するための対応処置を実行する必要がある場合があります。多くの場合、これはI/O処理には影響しませんが、このメッセージは、SFPトランシーバーまたは光ファイバー ケーブルのいずれかに関する構成の問題、潜在的なハードウェアの問題、または接続の問題を早期に示しています。
ほとんどの場合、光ファイバー ケーブルのLCコネクターの端面を正しくクリーニングして、光の屈折を妨げるほこりやその他のよごれを取り除くことで、この問題を簡単に解決できます。光ファイバー ケーブルのコネクター端面を点検およびクリーニングする方法については、次のナレッジベース記事のガイダンスに従ってください。「光ファイバー コネクター端面に付着したほこりなどの汚染物質が原因でIOパフォーマンスが低下する」
A41844 2024-08-12 10:45:54 112 INFORMATIONAL Host link down. (port: 1) A41853 2024-08-12 10:46:30 111 INFORMATIONAL Host link up. (port: 1, speed: 32 Gbps, point-to-point, fabric) A42131 2024-10-13 18:44:37 663 ERROR The host link PHY error count is greater than the error threshold. (port: 1, type: ) A42132 2024-10-13 18:46:44 663 RESOLVED The host link PHY error count has been resolved. (port: 1, type: resolved)
PowerVault ME5アレイのファームウェア バージョンME5.1.2.1.0以降では、FCポートの[Invalid Transmission Word Count]値を監視します。このカウンターの値は、ワードが正常に転送されず、エンコード エラーが発生したことを意味します。このカウンター値はPowerVault ManagerまたはCLIには表示されませんが、各ストレージ コントローラー(SC)のデバッグ ログに記録されます。コントローラーSCのデバッグ ログは、PowerVault MEサポート バンドル内で収集されます。「PowerVault ME5:PowerVaultサポート ログを収集する方法」を参照してください。
このエラー メッセージが頻繁に表示される場合、オペレーターは次のアクションを実行できます。
-
光ファイバー ケーブルの取り付けを点検し、光ファイバー ケーブル コネクターの端面を適切にクリーニングして、イベント663が繰り返し発生していないかどうかイベント履歴ログを監視します。「光ファイバー コネクター端面に付着したほこりなどの汚染物質が原因でIOパフォーマンスが低下する」を参照してください。
-
光ファイバー ケーブル コネクターをクリーニングしても問題が解消しない場合は、動作確認済みのトランシーバーと光ファイバー ケーブルと交換します。パーツが破損しておらず、正しく取り扱われていることを確認します。
-
トランシーバーを交換しても症状が解決しない場合、オペレーターは『Dell PowerVault ME5 Series Storage System Support Matrix』に記載されている検証済みのトランシーバーを使用する必要があります。それ以外の場合は、ベンダーにサポートを依頼してください。
-
まれに、旧世代の8 Gb FCスイッチを使用しているオペレーターは、スイッチのportCfgFillword設定を調整する必要がある場合があります。以下の「追加情報」セクションを参照してください。
シリアル接続SCSI (SAS)フロントエンド ポートを使用するコントローラー
各ホストからコントローラーへのSASケーブル接続は、複数の物理リンク(PHY)で構成されるSASワイド ポートを形成します。各PHYは、2つの差動信号ペアとして使用される4本のワイヤーのセットであり、データを両方向に同時に伝送することができます。
通常、これはI/O処理には影響しませんが、SASリンクの形成時にSASケーブルが挿入されると、このイベントが発生することが予期されます。冗長コントローラー構成では、接続されたホスト サーバーが起動し、ホスト オペレーティング システムのSASドライバーがロードされると、両方のコントローラーにイベント663が同時に記録されます。オペレーターによるそれ以上のアクションは必要ありません。
その他の考慮事項:
PowerVault MEコントローラーがDell SAS HBA355eに接続されている場合、ホスト サーバー ポート接続は、「Dell HBA355e SASコントローラーに接続されている場合、PowerVault ME5シリーズがホスト ポートの縮退を報告」に従って分散できます。変更後に、サーバーのSAS HBAまたはSAS HBAポートが使用されます。PowerVault Managerを使用して、ポート イニシエーターのWWN IDが正しいホストとボリュームにマッピングされていることを確認します。
SASケーブルの両端を慎重に引っ張り、SASケーブルがしっかりと挿入されていることを確認します。SASケーブルがポートから外れた場合は、正しく取り付け直します。コネクター ラッチを固定すると、カチッという音が聞こえます。SASケーブル コネクターを適切に固定できない場合は、ホスト サーバーで使用されているPCI-eスロットを確認します。シャーシ内のSAS HBAのスロット位置によってコネクターの挿入が妨げられている可能性があります。詳細については、「PowerEdge 16Gモデル:HBA355e PCI-eスロットの選択」を参照してください。
SASに接続されたホストが再起動されたときのPowerVault ME5イベント履歴ログの例。両方のコントローラーでイベントが記録され、シーケンスの最後のイベントは問題が解決されたことを示します。
B1473 2024-08-15 09:55:22 112 INFORMATIONAL Host link down. (port: 2) A3538 2024-08-15 09:55:26 112 INFORMATIONAL Host link down. (port: 2) B1483 2024-08-15 09:55:29 111 INFORMATIONAL Host link up. (port: 2, type: SAS) A3547 2024-08-15 09:55:32 111 INFORMATIONAL Host link up. (port: 2, type: SAS) A3911 2024-10-22 10:10:46 354 WARNING Host SAS topology was changed. (host port: 2, 0 out of 4 PHYs are up, link speed: Autonegotiated) B1640 2024-10-22 10:10:46 354 WARNING Host SAS topology was changed. (host port: 2, 0 out of 4 PHYs are up, link speed: Autonegotiated) A3912 2024-10-22 10:11:55 354 INFORMATIONAL Host SAS topology was changed. (host port: 2, 4 out of 4 PHYs are up, link speed: 12 Gbps) B1641 2024-10-22 10:11:55 354 INFORMATIONAL Host SAS topology was changed. (host port: 2, 4 out of 4 PHYs are up, link speed: 12 Gbps) A3913 2024-10-22 10:12:58 663 ERROR The host link PHY error count is greater than the error threshold. (port: 2, type: disparity errors, lost dword count, invalid dword count) B1642 2024-10-22 10:13:33 663 ERROR The host link PHY error count is greater than the error threshold. (port: 2, type: disparity errors, lost dword count, invalid dword count) A3914 2024-10-22 10:15:00 663 RESOLVED The host link PHY error count has been resolved. (port: 2, type: resolved)
Additional Information
8 Gbをサポートする旧世代のConnectrixまたはBrocade FCスイッチを使用しているオペレーターは、 portCfgFillword コマンドを使用してfillwordを設定できます。8 Gbスイッチが導入されたときに、主にビット エラーの低減に寄与する可能性があるという理由で、IDLEの代わりにARBffが採用されました。初期化に使用されるIDLEも、fillwordの変更に伴ってARBffに変更されました。
旧世代のFCスイッチのオペレーターが引き続き本番環境でそれらを使用している場合、[Invalid Transmission Word Count]カウンターが増加する可能性があり、常にARBffを使用するようにportcfgfillword値を設定する必要があります。Brocadeスイッチでは、これは「portcfgfillword --help」の出力です。
admin> portcfgfillword --help
Usage: portCfgFillWord [SlotNumber/]PortNumber Mode [Passive]
Mode: 0/-idle-idle - IDLE in Link Init, IDLE as fill word (default)
1/-arbff-arbff - ARBFF in Link Init, ARBFF as fill word
2/-idle-arbff - IDLE inLink Init, ARBFF as fill word (SW)
3/-aa-then-ia - If ARBFF/ARBFF failed, then do IDLE/ARBFF
Passive: 0/1
admin>
0: Use IDLE for initialization as 4Gb switches do.
1: Always use ARBff.
2: Use IDLE for initialization and use ARBff for between data frames.
3: Use ARBff for initialization first. If it fails, use IDLE. Use ARBff for between data frames.