Connectrix Cisco:MDS 9396Sファブリック スイッチでEOBC障害が停止して再ロードされるかログに記録される

概要: Connectrix Cisco:MDS 9396Sファブリック スイッチが停止して再ロードされるか、MDS 9700 32 Gbps FCモジュールがEOBC障害をログに記録することがある 問題の説明: この問題には、プラットフォームに依存する現象があります。 Cisco MDS 9396S 16Gマルチレイヤー ファブリック スイッチが予期せずリセットされることがあります。リセット中に、影響を受けるデバイスのポートがダウンし、デバイスを介したトラフィックの転送が中断されます。 Cisco MDS 9700 32 Gbps ラインカードは、一時的で無停止のイーサネット アウトオブバンド チャネル(EOBC)ハートビート障害 syslog メッセージをログに記録することがあります。 この問題は、次のいずれかのCisco MDS NX-OSリリースを実行している上記の製品にのみ適用されます。 8.4トレイン: リリース 8.4(2d) 以降 9.3トレイン: 任意の 9.3(x) リリース 9.4トレイン: リリース 9.4(2) より前の 9.4(x) リリース 以前のリリースは、FN72346に記載されている同様の問題の影響を受けました。 この問題の影響を受けるのは、一部のデバイスのみです。どのデバイスがいつ影響を受けるかを事前に判断することはできません。 ...

この記事は次に適用されます: この記事は次には適用されません: この記事は、特定の製品に関連付けられていません。 すべての製品パージョンがこの記事に記載されているわけではありません。

現象


症状は製品ごとに異なります。
 

Cisco MDS 9396Sファブリック スイッチの場合、スイッチはユーザー介入なしでリセットされます。
これにより、トラフィックが停止します。理由は「リセットのHAポリシー」であり、サービスは「f16_mac_usd」です。これは、show system reset-reasonコマンドで確認できます。

Reason: Reset triggered due to HA policy of Reset
Service: f16_mac_usd hap reset
Version: 8.4(2d)

Cisco MDS 9700 32 Gbps ラインカードでは、一時的な無停止の EOBC ハートビート障害が発生します。
モジュールからのEOBCハートビート障害syslogメッセージは、アクティブ スーパーバイザーとスタンバイ スーパーバイザーの両方で発生します。
これらは、次の例に示すように、show logging logfile コマンドで確認できます。

%MODULE-4-MOD_WARNING: Module 1 (Serial number: ...) reported warning 1/1-1/0 due to EOBC heartbeat failure on standby sup in device DEV_EOBC_MAC (device error 0xc0a0504f)
%MODULE-4-MOD_WARNING: Module 1 (Serial number: ...) reported warning 1/1-1/0 due to EOBC heartbeat failure in device DEV_EOBC_MAC (device error 0xc0a0514d)


どちらの場合も、マシン チェック エラーと 「MCSR=0x80200000」 値がイベント後に記録されます。

デバイスがこの問題の影響を受けているかどうかを確認するには、次のコマンドを実行します。

1)Cisco MDS 9396Sの場合は、show system internal kernel nvram-messages previous コマンドを使用します
2) Cisco MDS 9700 32 Gbps ラインカードの場合は、slot <slot> show system internal kernel messages コマンドを使用します( <slot> はモジュールのスロット番号です。


デバイスがこの問題の影響を受けている場合は、次の出力が表示されます。

Machine check in kernel mode on Core ... comm [...] pid [...]
L2 Machine check on Core ...: MCSR=0x80200000 ...

原因


この問題は、PCIe (Peripheral Component Interconnect Express)操作が不確定なランタイム後に失敗する可能性があることが原因で発生します。操作の成功または失敗は、操作によってアクセスされるアドレスによって異なります。これにより、さまざまな症状が発生し、どのデバイスが影響を受けるかを予測できなくなる可能性があります。

Cisco Bug: CSCwh53262 - 'machine check' error triggers reload on MDS 9396S switch and warning on MDS 32 Gbps FC linecard.


Field Notice: FN74128:
https://www.cisco.com/c/en/us/support/docs/field-notices/741/fn74128.html

デバイスで実行されているCisco MDS NX-OSのリリースを確認するには、show version CLIコマンドを入力します
次の例に示すように、リリースが[system]フィールドに表示されます。

switch# show version
...
  Software
  BIOS:      version 5.2.25
  loader:    version N/A
  kickstart: version 9.2(1)
  system:    version 9.2(1)

  
デバイスの製品IDを確認するには、show inventory CLIコマンドを入力します。製品IDは[PID]フィールドに表示されます

MDS 9396Sファブリック スイッチの場合:

switch# show inventory
NAME: "Chassis",  DESCR: "MDS 9396S 96X16G FC (2 RU) Chassis"
PID: DS-C9396S-K9        ,  VID: V00 ,  SN: JPG191800A0



MDS 9700 32 Gbps FCモジュールの場合:

SWのitch# show inventory
NAME: "Slot 1" ,  DESCR: "4/8/16/32 Gbps Advanced FC Module"
PID: DS-X9648-1536K9     ,  VID: V01 ,  SN: JAE210308AT


 

解決方法


対処方法:

この問題を一時的に回避するには、デバイスのアップタイムをゼロ日にリセットします。
 
デバイスの現在の稼働時間を表示するには、次のように入力します。 slot x show system uptime コマンド(xは関連デバイスのスロット番号)。MDS 9396Sファブリック スイッチのスロット番号は常に1です。

Cisco MDS 9396Sファブリック スイッチの場合は、無停止のスイッチ再ロードまたは無停止のスイッチ アップグレードを実行します。
スイッチを無停止でリロードするには、 reload system non-disruptive command.
スイッチのCPUが無停止で再ロードされている間、プロンプトが表示されるまでに数分かかります。
スイッチをNX-OSの別のリリースに無停止でアップグレードするには、 install all コマンド.

Cisco MDS 9700 32 Gbps FCモジュールでは、一時的なもので無停止であるため、回避策は必要ありません。


この問題を恒久的に解決するには、Cisco MDS NX-OSの修正済みバージョンにアップグレードします。修正は、Cisco MDS 9.4(2)リリースで利用可能です。

 

対象製品

Connectrix MDS-Series Firmware 8.X, Connectrix MDS-Series Firmware 9.X, Connectrix MDS 9396S

製品

Connectrix MDS-Series
文書のプロパティ
文書番号: 000224119
文書の種類: Solution
最終更新: 14 4月 2025
バージョン:  1
質問に対する他のDellユーザーからの回答を見つける
サポート サービス
お使いのデバイスがサポート サービスの対象かどうかを確認してください。