メイン コンテンツに進む
  • すばやく簡単にご注文が可能
  • 注文内容の表示、配送状況をトラック
  • 会員限定の特典や割引のご利用
  • 製品リストの作成とアクセスが可能
  • 「Company Administration(会社情報の管理)」では、お使いのDell EMCのサイトや製品、製品レベルでのコンタクト先に関する情報を管理できます。

「Connectrix:Fibre Channelノードをトラブルシューティングして、ポートまたはSFP通信の問題を排除する方法(セルフヘルプ)。

概要: この文書では、ファイバ チャネル ノードからスイッチ ポートまたはSFPへの通信の問題を排除してトラブルシューティングする方法について説明します。

この記事は自動翻訳されたものである可能性があります。品質に関するフィードバックがある場合は、このページの下部にあるフォームを使用してお知らせください。

文書の内容


現象

ファイバ チャネル ノードからスイッチ ポートまたはSFP通信の問題を排除してトラブルシューティングする方法

プロアクティブSFP交換
の数が多すぎる リンク障害
Gポート
No light
非動作シーケンス(NOS)
オフ ライン シーケンス(OLS)
信号
の損失 障害のあるSFP
FCポート
エラーのトラブルシューティング

原因

問題がSFPまたはスイッチの外部にある間に、プロアクティブに交換されたSFPが多すぎます。

解決方法

この問題を解決するには、次の手順に従います。

  1. 通信障害に関連するノードとスイッチ ポートを特定します。
  2. スイッチ ポートが管理上(ブロック解除、シャットダウンなし)、または有効になっていることを確認します。
  3. 続行する前に、接続されたデバイスで使用可能な冗長パスがあることを確認します。

 

警告:先に進む前に、ノードが新しいFCIDを取得した場合の反応を確認してください。FCIDはストレージ デバイスへのハードウェア パスに組み込まれているため、AIXおよびHP-UXの一部のオペレーティング システム バージョンは、このような変更にうまく反応しません。ケーブルを移動すると、データが使用できなくなる可能性があります。疑問がある場合は、EMCテクニカル サポート エンジニアにお問い合わせください。

 

  1. 問題のSFPを排除するには、次の手順を実行します。

 

メモ:  SFPに問題がある場合、この手順はデバイスをオンラインに戻す最も迅速な方法です。

 

  1. スイッチの空きポートを確認します。
  2. スイッチで識別された空きポートを無効にします。
  3. 調査するポートから、前の手順で新しい無効な空きポートにケーブルを移動します。
  1. 無効なポートを変更して状態を有効にし(または管理上)、デバイスをオンラインに戻します。
  2. スイッチで統計/カウンターをゼロにクリア/リセットします。(詳細については、メモ「 方法 」を参照してください)。
  3. それぞれのコマンドを使用してポートを4~6時間監視します。
  • エラー カウンターが増加した場合、問題はスイッチの外側にあります。お客様には次のアドバイスを受ける必要があります。
    • 新しいポートSFPとケーブルのクリーニングが必要です。(汚れたケーブルのSFPの汚れ防止。EMCクリーニング キットの使用を検討してください)。
    • 接続されているデバイスは、デバイスをサポートするユーザーによってさらに調査する必要があります。
    • Ciscoスイッチで、「errdisabled」状態がカウンターの増加なしで戻ってきた場合は、さらにバックエンド調査のためにSRを開く必要があります。
  • エラーが増加しない(またはCiscoスイッチのErrdisabled状態が戻らない)場合は、前のポートのSFPに欠陥があり、上記の解析結果、SFPの詳細(SMまたはMM、速度など)を提供するSFP交換のSRを発行します。

 

メモ: カウンターを確認して、ケーブルや接続デバイスを交換した場合は、ステップ6以降でも同じ手順を実行できます。

 

その他の情報

メモ: ほとんどの場合、SFP光トランシーバーに間違いなく障害が発生すると、イベント ログに明確な光メディア障害が表示されます。

ハードウェア障害は、単純なアルゴリズムを問題に適用することで簡単に切り分けることができます。このハードウェアでない場合は、もう一方の部分です。障害を特定するまでループします。


BROCADEの例:
メモ: カウンターの説明または説明については、ナレッジベース記事「
Connectrix B-Series: Brocadeのporterrshowの出力を解釈する方法と、カウンターの意味(英語)」


例1:リンクの失敗と損失の同期を伴うENC OUT:

 

porterrshow        :
CURRENT CONTEXT -- 3 , 111
     frames        enc  crc  crc    too   too   bad  enc   disc  link  loss  loss  frjt  fbsy  c3timeout    pcs
     tx     rx     in   err  g_eof  shrt  long  eof  out   c3    fail  sync  sig               tx    rx     err
xx:  849.1k 493.2k 0    0    0      0     0     0    2.3m  0     4     6     0     0     0     0      0     0


一般的な理由:
過去24時間以内にポート統計情報がクリアされている場合にのみ有効です。それ以外の場合は、これらのカウンターを履歴として分類します。ポート統計情報(https://support.emc.com/kb/304525)をクリアし、4~6時間後にデータを再受験します。

エラーから、リンクの失敗と同期プラス の損失エラーが表示されます。これには損失 sig エラーも含まれる場合があります。
これらのエラーの組み合わせは、通常、ホストの再起動またはスイッチの外部へのリンク リセットを示します。エンアウト エラーは、リンク初期化の一環として、速度ネゴシエーション中に発生します。

予期されるアクション:
ポートに接続されているデバイスに、オフラインまたはオンラインになる正当な理由があることを確認します。たとえば、ホストの再起動などです。そうでない場合は、SRを発行します。


例2 ENC OUT:

porterrshow        :
CURRENT CONTEXT -- 3 , 111
     frames        enc  crc  crc    too   too   bad  enc   disc  link  loss  loss  frjt  fbsy  c3timeout    pcs
     tx     rx     in   err  g_eof  shrt  long  eof  out   c3    fail  sync  sig               tx    rx     err
xx:  849.1k 493.2k 0    0    0      0     0     0    2.3m  0     0     0     0     0     0     0      0     0


一般的な理由:
過去24時間以内にポート統計情報がクリアされている場合にのみ有効です。それ以外の場合は、これらのカウンターを履歴として分類します。ポート統計情報(https://support.emc.com/kb/304525)をクリアし、4~6時間後にデータを再受験します。

エンアウト エラーに関連するエラーがない場合は、ダーティー ケーブルを示します。

予期されるアクション:
このポートと接続されたデバイスに接続されているケーブルとSFPのすべての光ファイバー面を検査してクリーニングします。


例3:CRCおよびCRC G_EOF:

porterrshow        :
CURRENT CONTEXT -- 3 , 111
     frames        enc  crc  crc    too   too   bad  enc   disc  link  loss  loss  frjt  fbsy  c3timeout    pcs
     tx     rx     in   err  g_eof  shrt  long  eof  out   c3    fail  sync  sig               tx    rx     err
xx:  849.1k 493.2k 0    1.2k 1.2k   0     0     0    0     0     0     0     0     0     0     0      0     0


一般的な理由:
過去24時間以内にポート統計情報がクリアされている場合にのみ有効です。それ以外の場合は、これらのカウンターを履歴として分類します。ポート統計情報(https://support.emc.com/kb/304525)をクリアし、4~6時間後にデータを再受験します。

フレームは不正なCRCでスイッチ ポートに入っていますが、フレームの終わりはまだ良好とマークされています。
これは、不良フレームを登録する最初のポートであることを示しています。問題は、この特定のポート上のSFP/ケーブル/接続デバイス インターフェイスのいずれかです。

予期されるアクション:
解決策のデフォルトのアクションを参照してください。

ISLポートの場合は、statsclearおよび slotstatsclear commands を使用して統計情報をクリアし、4~6時間待ってから、スイッチとオープンSRの両方からsupportsaveを収集して通常のトラブルシューティングを行います。

例4 CRC:

porterrshow        :
CURRENT CONTEXT -- 3 , 111
     frames        enc  crc  crc    too   too   bad  enc   disc  link  loss  loss  frjt  fbsy  c3timeout    pcs
     tx     rx     in   err  g_eof  shrt  long  eof  out   c3    fail  sync  sig               tx    rx     err
xx:  849.1k 493.2k 0    1.2k 0      0     0     0    0     0     0     0     0     0     0     0      0     0


一般的な理由:
過去24時間以内にポート統計情報がクリアされている場合にのみ有効です。それ以外の場合は、これらのカウンターを履歴として分類します。ポート統計情報(https://support.emc.com/kb/304525)をクリアし、4~6時間後にデータを再受験します。

ポートは、不正なCRCフレームでスイッチに入るフレームを記録していますが、フレームはすでに不良としてマークされています。通常、これはISLおよびNPIV Fポートで確認できます。

予期されるアクション:
CRCエラーがNPIVポートでログに記録されている場合は、ベンダーを維持してデバイスを調査します。
ISLポートの場合は、ファブリック内のすべてのポートでCRC g_oefおよびアクションをログに記録しているかどうかを確認します(例3を参照)。


例5 PCS ERR with LINK FAIL AND LOSS SYNC:

porterrshow        :
CURRENT CONTEXT -- 3 , 111
     frames        enc  crc  crc    too   too   bad  enc   disc  link  loss  loss  frjt  fbsy  c3timeout    pcs
     tx     rx     in   err  g_eof  shrt  long  eof  out   c3    fail  sync  sig               tx    rx     err
xx:  849.1k 493.2k 0    0    0      0     0     0    0     0     4     4     0     0     0     0      0     466


一般的な理由:
過去24時間以内にポート統計情報がクリアされている場合にのみ有効です。それ以外の場合は、これらのカウンターを履歴として分類します。ポート統計情報(https://support.emc.com/kb/304525)をクリアし、4~6時間後にデータを再受験します。

これは、10 Gbpsまたは16 Gbpsポート(6505/6510/6520/DCX-8510)をサポートするプラットフォームにのみ適用され、Gen5プラットフォームのCondor3 ASICで導入されました。ER_PCS_BLKは、Physical Coding Sublayer (PCS)ブロック エラーの数を示しています。このカウンターは、8 Gb/4 Gbリンクのenc_outと同等であり、10 GBおよび16 GBの速度でのみ使用されます。
エラーから、リンクの失敗と同期の喪失とpc errエラーが表示されます。これには、loss sigエラーも含まれる場合があります。
これらのエラーの組み合わせは、通常、ホストの再起動またはスイッチの外部へのリンク リセットを示します。
pcs errエラーは、リンク初期化の一環として速度ネゴシエーション中に発生します。

予期されるアクション:
ポートに接続されているデバイスに、オフラインまたはオンラインになる正当な理由があることを確認します。たとえば、ホストの再起動などです。そうでない場合は、SRを発行します。


例6 PCS ERR:

porterrshow        :
CURRENT CONTEXT -- 3 , 111
     frames        enc  crc  crc    too   too   bad  enc   disc  link  loss  loss  frjt  fbsy  c3timeout    pcs
     tx     rx     in   err  g_eof  shrt  long  eof  out   c3    fail  sync  sig               tx    rx     err
xx:  849.1k 493.2k 0    0    0      0     0     0    0     0     0     0     0     0     0     0      0     466


一般的な理由:
過去24時間以内にポート統計情報がクリアされている場合にのみ有効です。それ以外の場合は、これらのカウンターを履歴として分類します。ポート統計情報(https://support.emc.com/kb/304525)をクリアし、4~6時間後にデータを再受験します。

関連するエラーがない PCS ERR エラーは、ダーティー ケーブルを示します。

予期されるアクション:
このポートと接続されたデバイスに接続されているケーブルとSFPのすべての光ファイバー面を検査してクリーニングします。

CISCOの例:

例1:

Errdisabled - インターフェイス エラーの増加なし
 

fc1/1 is down (Error disabled - bit error rate too high)
    Hardware is Fibre Channel, SFP is short wave laser w/o OFC (SN).
    5 minutes input rate 0 bits/sec, 0 bytes/sec, 0 frames/sec
    5 minutes output rate 0 bits/sec, 0 bytes/sec, 0 frames/sec
      179 frames input, 7668 bytes
        0 discards, 0 errors
        0 CRC,  0 unknown class
        0 too long, 0 too short
      23 frames output, 1320 bytes
        0 discards, 0 errors
      1 input OLS, 1 LRR, 0 NOS, 1 loop inits
      2 output OLS, 0 LRR, 0 NOS, 1 loop inits
    Interface last changed at Thu Jun  5 01:51:00 2014


一般的な理由:

インターフェイスの「Errdisabled」状態は、フロントエンドでインターフェイス カウンターがクリーンになり、スイッチが「errdisabled」状態でポートをダウンしているように見え、バックエンド(ASIC/内部/ラインカード)

でエラー カウンターが増加するため、少し誤解を招く可能性があります。予期されるアクション:

解決策の「デフォルトのアクション」を参照してください。再度発生する場合は、テクニカル サポートの詳細出力を収集し、SRを開きます。
 

メモ: Ciscoの「Errdisabled」状態に関する情報: ビット エラーは、次の理由で発生する可能性があります。
  • ケーブルの障害または不良
  • SFPの障害または不良
  • SFPは1 Gbpsで動作するように指定されていますが、2 Gbpsで使用されます。
  • SFPは2 Gbpsで動作するように指定されていますが、4 Gbpsで使用されます。
  • 短距離ケーブルは、長距離に使用されるか、または長距離ケーブルが短距離に使用されます。
  • 一時的な同期消失
  • 一方または両端のケーブル接続が緩んでいる
  • 一方または両方の端での不適切なSFP接続
5分間に15件のエラー バーストが発生すると、ビット エラー レートのしきい値が検出されます。デフォルトでは、しきい値に達すると、スイッチはインターフェイスを無効にします。インターフェイスを再度有効にするには、シャットダウンとシャットダウンなしのコマンド シーケンスを入力できます。

しきい値を超えたときにインターフェイスを無効にしないようにスイッチを設定できます。デフォルトでは、しきい値はインターフェイスを無効にします。


例 2:

CRUの増分
 

fc13/1 is down (Initializing)
    Port description is ***
    Hardware is Fibre Channel, SFP is long wave laser cost reduced
.
    5 minutes input rate 32 bits/sec, 4 bytes/sec, 0 frames/sec
    5 minutes output rate 32 bits/sec, 4 bytes/sec, 0 frames/sec
      162 frames input, 6136 bytes
        0 discards, 17 errors
        17 CRC,  0 unknown class
        0 too long, 17 too short
      74 frames output, 6304 bytes
        2 discards, 0 errors
      108 input OLS, 54 LRR, 2 NOS, 0 loop inits
      83 output OLS, 26 LRR, 56 NOS, 0 loop inits
    Interface last changed at Tue May 27 08:37:20 2014


一般的な理由:

ポートはフレームを記録しており、不正なCRCでスイッチに入りますが、フレームの端は良好です。CRCカウンターは、エラーを記録する特定の入力ポートでのみ増分され、この物理リンクで調査を行う必要があります。

予期されるアクション:

解決策のデフォルトのアクションを参照してください。

Ciscoスイッチの統計情報のクリア:

次のコマンドを使用します。

  • インターフェイス カウンターをクリアするには、次の手順を実行します。
MDS-9509# clear counters interface all

 

  • ポート チャネルが設定されている場合にインターフェイス カウンターをクリアするには、次の手順を実行します。
MDS-9509# clear counters interface port-channel 

 

  •  ASICカウンターをクリアするには、すべてのライン カードに「接続」する必要があります。Example:
MDS-9509# attach module 1
Attaching to module 1 ...
To exit type 'exit', to abort type '$.'
Bad terminal type: "ansi". Will assume vt100.
module-1# clear asic-cnt all

 

文書のプロパティ


影響を受ける製品

Connectrix

製品

Connectrix, Connectrix B-Series Hardware, Connectrix MDS-Series Hardware

最後に公開された日付

02 10月 2023

バージョン

5

文書の種類

Solution