新しい会話を開始

未解決

この投稿は5年以上前のものです

Community Manager

 • 

3.1K メッセージ

1151

2017年7月18日 18:00

Connectrix - B Series:firmwaredownload、HAfailover/HAreboot、または電源投入時の再起動の実行後に、CP8ブレードまたはスイッチで障害が発生するか、応答しない(FAULTY (53) - possible RRD)。(000486865)

バージョン:2

記事タイプ:不具合修正

対象読者:レベル30 = お客様

最終発行日:201685日金曜日15:26:06GMT

概要:

firmwaredownloadHAfailover/HAreboot、または電源投入時の再起動の実行後に、CP8ブレードまたはスイッチで障害が発生するか、

応答しません FAULTY (53) - possible RRD)。

問題:

この問題は、CP8Brocade 800053006520、またはBrocade Encryption Switchの再起動時に、RTCをホストしているプライベート バスが異常停止した場合に発生する可能性があります。電源投入時にカーネルの再ロードを行うアクティビティ(HAfailover/HAreboot、電源投入時の再起動、firmwaredownload、パニック)は、この問題を引き起こす可能性があります。

最も顕著で一般的な症状は、CP8またはスイッチが電源投入時の再ロード後に応答しなくなることです。再起動の異常停止が予測される一般的な症状は、hwclockコマンドです。

影響を受けたユニットには次の症状が現れます。

1.    /sbin/hwclockコマンドの実行が失敗し、次の応答が表示されます。

/ sbin / hwclock

RTC_RD_TIME: Bad address

ioctl () to /dev/ rtc to read the time failed.

2.    前述の失敗を示したユニットを再起動すると、次の起動フェーズでも異常停止したままで、シリアル コンソールには次のメッセージのみが表示されます。

"The system is coming up, please wait..." "The system is coming up, please wait..."

他の症状は、フォーム ファクタ(ブレードを備えたダイレクターまたはスイッチ)によって異なります。

-----CP8ベース ダイレクターの場合:

アクティブCPが電源投入時の再起動を実行すると、スタンバイCPが引き継ぎ、再起動したばかりのCPが異常停止します。

新しくアクティブになったCPは、異常停止したCPが原因でHA同期を取得できません。slotshowコマンドを実行すると、次のように表示されます。slotshow -m :

Slot Blade Type ID Model Name Status

--------------------------------------------------

1 SW BLADE 96 FC16-48 ENABLED

...簡潔に示すために削除...

6 CP BLADE 50 CP8 ENABLED

7 CP BLADE 50 CP8 FAULTY (53) - possible RRD

注:

slotshowは可能性のあるRRD(Rolling Reboot Detection)を示しますが、RASLOGは再起動回数が1回のみの異常停止CP(異常停止しており、RRDのトリガーに必要な複数回の起動を実行できない)を示します。

[EM-1033], 22526/14644, SLOT 6 | CHASSIS, ERROR, DCX001, CP in Slot 7 set to faulty because CP ERROR asserted

実際のローリング再起動では、30分のタイム ウィンドウ内で5~6個のEM-1033メッセージが表示されると予想されます。

firmwaredownloadでは、新しいバージョンのCPへのHAfailoverを無停止で行う必要があります。しかし、firmwaredload全体が失敗し、新しくアクティブになったCPが新しいコード バージョンのままとなり、次のRASLOGメッセージが表示される可能性があります。

2016/03/29-20:30:01:448115, [SULB-1011], 22540/14651, SLOT 6 | CHASSIS, INFO, DCX001, Firmwaredownload

command failed. Active and Standby CPs failed to gain HA synchronization within 10 minutes. Firmwaredownload is aborted

注:ファームウェアのアップグレード中や、異常停止CPの電源を入れ直した後に問題が発生した場合は、元のコード バージョンのままである可能性があるため、firmwaredownload -sコマンドを使用して個別にアップグレードする必要があります。

解決方法:                                次の手順を使用することで、この問題をプロアクティブに特定し、計画を立てることができます。

------ダイレクター クラス スイッチ(CP8):

1. アップグレードまたはHAfailoverを実行する前に、「root」でログインして次のコマンドを実行することで、すべてのCP(アクティブおよびスタンバイ)をチェックし、hwclockコマンドが適切に機能していることを確認します。

/sbin/hwclock

時刻が返されます。たとえば、次のようになります。

DCX:root> /sbin/hwclock

Thu Mar 31 16:58:29 2016 -0.000354 seconds

次が返された場合は、電源投入時の再起動が異常停止する可能性が最も高くなります。

/sbin/hwclock

RTC_RD_TIME: Bad address

ioctl() to /dev/rtc to read the time failed.

このRTCアクセスの問題が発生しているCPに対して、次の手順を実行することをお勧めします。

1. アクティブCPで問題が発生し、HAが同期されている場合:

a:HAfailoverを実行します。

b:完了すると、(前はアクティブだった)このCPはおそらく起動時に異常停止します。これをリシートします。

c:HAが同期状態に戻ったら、両方のCP/sbin/hwclockコマンドを実行して、RTCの問題が修正されたことを確認します。

d:予想した時刻が返された場合、必要に応じてアップグレード/ダウングレードに進みます。

2. アクティブCPで問題が発生し、HAが同期されていない場合:

a:メンテナンス ウィンドウを取得し、アクティブCPをリシートします。

3. スタンバイCPで問題が発生する場合:

a:スタンバイCPブレードをリシートします。

b:HAが同期状態に戻ったら、両方のCP/sbin/hwclockコマンドを実行して、RTCの問題が修正されたことを確認します。

c:予想した時刻が返された場合、必要に応じてアップグレード/ダウングレードに進みます。

------ダイレクター クラス スイッチ以外(Brocade 800053006520Brocade Encryption Switch):

1. アップグレードまたはHArebootを実行する前に、「root」でスイッチにログインして、次のコマンドを実行します。

/sbin/hwclock

時刻が返されます。たとえば、次のようになります。

6520:root> /sbin/hwclock

Thu Mar 31 16:58:29 2016 -0.000354 seconds

次が返された場合は、電源投入時の再起動が異常停止する可能性が最も高くなります。

/sbin/hwclock

RTC_RD_TIME: Bad address

ioctl() to /dev/rtc to read the time failed.

スイッチでこの問題が発生した場合は、メンテナンス ウィンドウをスケジュール設定し、スイッチの電源を入れ直します。

解決方法

起動時のCP8/スイッチの異常停止を回避する必要があるRTCクロックをホストしているバスをフラッシュするように、コード変更が行われています。この状態からリカバリするには、ダイレクター クラス スイッチの影響を受ける/異常停止しているCPブレードをリセットします。

影響を受ける、ダイレクター クラス以外のスイッチのPOR(電源投入時リセット)を実行する時間をスケジュール設定します。スイッチをFOS v 7.3.2bv7.4.1dv8.0.1b、または欠陥594896に対する修正が行われているFOSバージョンにアップグレードします。

注:DEFECT000594896に対する修正が行われていないFOSバージョンからのアップグレードを実行しても、RTCクロックの問題によって起動時に引き続き異常停止が発生する場合があります。そのため、前述の回避策を実施することをお勧めします。DEFECT000594896に対する修正を含むバージョンからアップグレードする場合は、それ以降のアップグレードでRTCの異常停止や起動時の異常停止が発生することはありません。

プライマリ製品:                          Connectrix B-Series Fabric OS 7.X

製品:                                      Connectrix B-Series Fabric OS 7.XConnectrix ED-DCX8510-8BConnectrix ED-DCX8510-4BConnectrix ED-DCX-4S-BConnectrix ED-DCX-BConnectrix DS-6520BConnectrix ES-5832BConnectrix DS-5300BConnectrix B-Series Fabric OS 7.X 7.3.1Connectrix B-Series Fabric OS 7.X 7.3.1aConnectrix B-Series Fabric OS 7.X 7.3.1cConnectrix B-Series Fabric OS 7.X 7.3.1dConnectrix B-Series Fabric OS 7.X 7.3.1eConnectrix B-Series Fabric OS 7.X 7.4.0Connectrix B-Series Fabric OS 7.X 7.4.0aConnectrix B-Series Fabric OS 7.X 7.4.0cConnectrix B-Series Fabric OS 7.X 7.4.0eConnectrix B-Series Fabric OS 7.X 7.4.1Connectrix B-Series Fabric OS 7.X 7.4.1aConnectrix B-Series Fabric OS 7.X 7.4.1bConnectrix B-Series Fabric OS 7.X 7.4.1cConnectrix B-Series Fabric OS 7.X 7.2.1fConnectrix B-Series Fabric OS 7.X 7.2.1gConnectrix B-Series Fabric OS 7.X 7.3.0Connectrix B-Series Fabric OS 7.X 7.3.0bConnectrix B-Series Fabric OS 7.X 7.3.0cConnectrix B-Series Fabric OS 8.X

この文書は次のディスカッションから生成されました:

486865 : Connectrix B-Series:  CP8 blades or switches being faulted (FAULTY (53) - possible RRD) or unresponsive after doing a firmwaredownload, HAfailover/HAreboot, or power-on reboot.

レスポンスがありません。
イベントは見つかりませんでした!

Top