Connectrix Cisco:MDS 9396Sファブリック スイッチでEOBC障害が停止して再ロードされるかログに記録される
概要: Connectrix Cisco:MDS 9396Sファブリック スイッチが停止して再ロードされるか、MDS 9700 32 Gbps FCモジュールがEOBC障害をログに記録することがある 問題の説明: この問題には、プラットフォームに依存する現象があります。 Cisco MDS 9396S 16Gマルチレイヤー ファブリック スイッチが予期せずリセットされることがあります。リセット中に、影響を受けるデバイスのポートがダウンし、デバイスを介したトラフィックの転送が中断されます。 Cisco MDS 9700 32 Gbps ラインカードは、一時的で無停止のイーサネット アウトオブバンド チャネル(EOBC)ハートビート障害 syslog メッセージをログに記録することがあります。 この問題は、次のいずれかのCisco MDS NX-OSリリースを実行している上記の製品にのみ適用されます。 8.4トレイン: リリース 8.4(2d) 以降 9.3トレイン: 任意の 9.3(x) リリース 9.4トレイン: リリース 9.4(2) より前の 9.4(x) リリース 以前のリリースは、FN72346に記載されている同様の問題の影響を受けました。 この問題の影響を受けるのは、一部のデバイスのみです。どのデバイスがいつ影響を受けるかを事前に判断することはできません。 ...
現象
症状は製品ごとに異なります。
Reason: Reset triggered due to HA policy of Reset
Service: f16_mac_usd hap reset
Version: 8.4(2d)
Cisco MDS 9700 32 Gbps ラインカードでは、一時的な無停止の EOBC ハートビート障害が発生します。
これらは、次の例に示すように、show logging logfile コマンドで確認できます。
%MODULE-4-MOD_WARNING: Module 1 (Serial number: ...) reported warning 1/1-1/0 due to EOBC heartbeat failure on standby sup in device DEV_EOBC_MAC (device error 0xc0a0504f)
%MODULE-4-MOD_WARNING: Module 1 (Serial number: ...) reported warning 1/1-1/0 due to EOBC heartbeat failure in device DEV_EOBC_MAC (device error 0xc0a0514d)
どちらの場合も、マシン チェック エラーと 「MCSR=0x80200000」 値がイベント後に記録されます。
デバイスがこの問題の影響を受けているかどうかを確認するには、次のコマンドを実行します。
2) Cisco MDS 9700 32 Gbps ラインカードの場合は、slot <slot> show system internal kernel messages コマンドを使用します( <slot> はモジュールのスロット番号です。
デバイスがこの問題の影響を受けている場合は、次の出力が表示されます。
Machine check in kernel mode on Core ... comm [...] pid [...]
L2 Machine check on Core ...: MCSR=0x80200000 ...
原因
この問題は、PCIe (Peripheral Component Interconnect Express)操作が不確定なランタイム後に失敗する可能性があることが原因で発生します。操作の成功または失敗は、操作によってアクセスされるアドレスによって異なります。これにより、さまざまな症状が発生し、どのデバイスが影響を受けるかを予測できなくなる可能性があります。Cisco Bug: CSCwh53262 - 'machine check' error triggers reload on MDS 9396S switch and warning on MDS 32 Gbps FC linecard.
Field Notice: FN74128:
https://www.cisco.com/c/en/us/support/docs/field-notices/741/fn74128.html
デバイスで実行されているCisco MDS NX-OSのリリースを確認するには、show version CLIコマンドを入力します
次の例に示すように、リリースが[system]フィールドに表示されます。
switch# show version
...
Software
BIOS: version 5.2.25
loader: version N/A
kickstart: version 9.2(1)
system: version 9.2(1)
デバイスの製品IDを確認するには、show inventory CLIコマンドを入力します。製品IDは[PID]フィールドに表示されます
MDS 9396Sファブリック スイッチの場合:
switch# show inventory
NAME: "Chassis", DESCR: "MDS 9396S 96X16G FC (2 RU) Chassis"
PID: DS-C9396S-K9 , VID: V00 , SN: JPG191800A0
MDS 9700 32 Gbps FCモジュールの場合:
itch# show inventoryNAME: "Slot 1" , DESCR: "4/8/16/32 Gbps Advanced FC Module"PID: DS-X9648-1536K9 , VID: V01 , SN: JAE210308AT
解決方法
対処方法:
slot x show system uptime コマンド(xは関連デバイスのスロット番号)。MDS 9396Sファブリック スイッチのスロット番号は常に1です。
Cisco MDS 9396Sファブリック スイッチの場合は、無停止のスイッチ再ロードまたは無停止のスイッチ アップグレードを実行します。
スイッチを無停止でリロードするには、
reload system non-disruptive command.
スイッチのCPUが無停止で再ロードされている間、プロンプトが表示されるまでに数分かかります。
スイッチをNX-OSの別のリリースに無停止でアップグレードするには、
install all コマンド.
Cisco MDS 9700 32 Gbps FCモジュールでは、一時的なもので無停止であるため、回避策は必要ありません。
この問題を恒久的に解決するには、Cisco MDS NX-OSの修正済みバージョンにアップグレードします。修正は、Cisco MDS 9.4(2)リリースで利用可能です。