イベント「0x8a4861d7」および「0x8a4861d6」がVS6 BBUに対して生成される(000533159)

評価なし
モデレーター
モデレーター

イベント「0x8a4861d7」および「0x8a4861d6」がVS6 BBUに対して生成される(000533159)

プライマリ製品:VPLEXシリーズ

製品:VPLEX VS6、VPLEX GeoSynchrony 6.0、VPLEX GeoSynchrony 6.1、VPLEXシリーズ、VPLEX GeoSynchrony、VPLEX Local、VPLEX Metro、VPLEX GeoSynchrony 6.0 Service Pack 1パッチ7、VPLEX GeoSynchrony 6.0 Service Pack 1パッチ6

バージョン:3

記事タイプ:不具合修正

対象読者:レベル30 = お客様

最終発行日:2019年11月28日木曜日07:04:20(GMT)

 

サマリー:

GeoSynchronyのコード バグによって、イベント「The specified FRU is not present」および「The operational state of the specified fru is Faulted」のコールホームが VS6 BBUと電源装置に対して毎日発生します。これらは偽陽性であり、 ハードウェアは実際には正常に動作しているため、不要な調査につながります。また、このKBでは、VS6環境における 障害が発生したBBUの状態の確認方法についても説明しています。

 

問題:

VS6システムで、「0x8a4861d7」および「0x8a4861d6」のコール ホームが毎日呼び出されます。その際、BBUまたは電源装置について「The state of the specified FRU is faulted」が報告され、後にダイレクターが次のように「The specified FRU is not present」を示します(ピア ダイレクターによって報告)。

例:

<EventData><![CDATA[/engine/bbu-a0: PartNo 078-000-123-05 /SerialNo ACPHxxxxxx0168 /RevNo FFF :The operational state of the specified fru is Faulted. [Versions:MS\{D50.10.0.21.0, D50.10.0.16, D50.10.0.24}, Director\{7.5.125.21.0}, ClusterWitnessServer\{D50.10.0.24}] RCA: The state of the specified FRU is faulted Remedy: Contact EMC Customer Support.

<EventData><![CDATA[/engine/hyperion@a: :The specified FRU is not present. [Versions:MS\{D50.10.0.21.0, D50.10.0.16, D50.10.0.24}, Director\{7.5.125.21.0}, ClusterWitnessServer\{D50.10.0.24}] RCA: The specified FRU is not present. Remedy: Check if the correct FRU has been inserted in the slot. If the problem persists, contact EMC Customer Support.
 
ダイレクターのzpem.logには、ハードウェアに実際に障害が発生していない場合でも(偽陽性イベント)、BBUまたは電源装置が故障し、交換が必要であることを示す、次のようなイベントが記録されることがあります。  この場合、ハードウェアの交換によって、イベント(およびコールホーム)が解決されることはありません。

Mar 28 08:54:08 director-1-1-a zpem[4709]: CRITICAL: /engine/psa1 (AC7Nxxxxxx0633): output-over-voltage-fault is true
Mar 28 08:54:08 director-1-1-a zpem[4709]: CRITICAL: /engine/psa1 (AC7Nxxxxxx0633): output-under-voltage-fault is true
Mar 28 08:54:08 director-1-1-a zpem[4709]: CRITICAL: /engine/psa1 (AC7Nxxxxxx0633): general-fault is true
Mar 28 08:54:08 director-1-1-a zpem[4709]: CRITICAL: /engine/psa1 (AC7Nxxxxxx0633): SMS ERR: The operational state of the specified fru is Faulted.
Mar 28 08:54:21 director-1-1-a zpem[4709]: CRITICAL: /engine/bbu-a0 (ACPTxxxxxx0236): internal-fault is true
Mar 28 08:54:21 director-1-1-a zpem[4709]: CRITICAL: /engine/bbu-a0 (ACPTxxxxxx0236): SMS ERR: The operational state of the specified fru is Faulted.
Mar 28 08:54:56 director-1-1-a zpem[4709]: CRITICAL: /engine/bbu-a0 (ACPTxxxxxx0236): internal-fault is true
Mar 28 08:54:56 director-1-1-a zpem[4709]: CRITICAL: /engine/bbu-a0 (ACPTxxxxxx0236): SMS ERR: The operational state of the specified fru is Faulted.
Mar 28 08:55:18 director-1-1-a zpem[4709]: CRITICAL: /engine/bbu-a1 (ACPTxxxxxx0351): battery-ready is false
Mar 29 09:06:13 director-1-1-a zpem[4759]: CRITICAL: /engine/bbu-a0 (ACPTxxxxxx0236): battery-enabled is false
Mar 29 09:06:13 director-1-1-a zpem[4759]: CRITICAL: /engine/bbu-a0 (ACPTxxxxxx0236): battery-ready is false
Mar 29 09:06:14 director-1-1-a zpem[4759]: CRITICAL: /engine/bbu-a1 (ACPTxxxxxx0351): battery-enabled is false
Mar 29 09:06:14 director-1-1-a zpem[4759]: CRITICAL: /engine/bbu-a1 (ACPTxxxxxx0351): battery-ready is false
Mar 29 09:06:14 director-1-1-a zpem[4759]: CRITICAL: /engine/bbu-a1 (ACPTxxxxxx0351): requires-replacement is True
Mar 29 09:06:14 director-1-1-a zpem[4759]: CRITICAL: /engine/bbu-a1 (ACPTxxxxxx0351): SMS ERR: The operational state of the specified fru is Faulted.


次のイベントは、頻繁に発生するバッテリー充電に関して、ファームウェアおよびzpemのログに頻繁に表示されることがあります。

128.221.252.68/xmmg/log:5988:W/"0060167328a822200":14548:<4>2018/03/12 18:28:16.81: ZPEM/210 /engine/bbu-b0: PartNo 078-000-123-05 /SerialNo ACPHxxxxxx0206 /RevNo FFF :battery-charging is true
128.221.253.68/xmmg/log:5988:W/"0060167328a822200":14549:<6>2018/03/12 18:31:34.45: ZPEM/66 /engine/bbu-b0: PartNo 078-000-123-05 /SerialNo ACPHxxxxxx0206 /RevNo FFF :battery-fully-charged is true

注:
これらのイベントについては、BBUが頻繁に充電済みから充電中に切り替わることが予期されます。この現象は、すべてのVS6で確認されます。  参考文書KBA 531093:VPLEX:BBUが頻繁に「Charging」から「Fully-Charged」に切り替わる(000531093)

 

原因:

GeoSynchronyコードの内部コンポーネントは、ハードウェアの監視を担当しますが、それは定期的なポーリングによって行われます。  A/Bダイレクター ペア間のリモート ポーリングに関わるハードウェア監視の一部は、非常に低速なリンクを使用して行われていたため、一部のポーリング サイクルが欠落することとなりました。 
欠落したポーリング サイクルによって、ハードウェアとの接続が失われ、ハードウェアが欠落したとコンポーネントに認識されていました(実際にはそうではありませんでした)。  これにより、「the FRU is not present」および「the state of the specified FRU is faulted.」という偽陽性イベントがトリガーされました。

 

解決方法:

恒久対策:
この問題は、GeoSynchrony 6.1パッチ1で恒久的に修正されています。
上記の修正バージョンでは、A/Bダイレクター ペア間のリモート ポーリングに関係したハードウェア監視が一部削除されています(削除された情報はローカルに収集されるため、リモート ダイレクターへの格納が必要であるとはみなされませんでした)。それにより、ポーリング サイクルが欠落しなくなり、偽陽性イベントがトリガーされなくなっています。

回避策:

1)VPlexcliプロンプトで次のコマンドを実行して、BBUの「operational-status」が「online」状態であり、ハードウェア障害が発生していないことが次のように示されることを確認してください。
 
login as: service
Using keyboard-interactive authentication.
Password:
Last login: Wed Apr 13 18:05:04 2019 from xx.xx.xx.xx
service@ ManagementServer:~> vplexcli

VPlexcli:/> ll **/engines/engine-1-1/battery-backup-units/*
/engines/engine-1-1/battery-backup-units/battery-backup-unit-A0: 
Name                    Value 
----------------------  -------------- 
battery-fully-charged   true       
battery-test-result     passed 
battery-time-remaining  65535 
family-fru-id           0x0015000e 
marker-led              off 
on-battery              false 
operational-status      online 
part-number             078-000-123-05 
revision-number         FFF 
serial-number           ACPTxxxxxx0319 

/engines/engine-1-1/battery-backup-units/battery-backup-unit-A1: 
Name                    Value 
----------------------  -------------- 
battery-fully-charged   true 
battery-test-result     passed 
battery-time-remaining  65535 
family-fru-id           0x0015000e 
marker-led              off 
on-battery              false 
operational-status      online 
part-number             078-000-123-05 
revision-number         FFF 
serial-number           ACPTxxxxxx0097 

/engines/engine-1-1/battery-backup-units/battery-backup-unit-B0: 
Name                    Value 
----------------------  -------------- 
battery-fully-charged   true 
battery-test-result     passed 
battery-time-remaining  65535 
family-fru-id           0x0015000e 
marker-led              off 
on-battery              false 
operational-status      online 
part-number             078-000-123-05 
revision-number         FFF 
serial-number           ACPTxxxxxx0093 

/engines/engine-1-1/battery-backup-units/battery-backup-unit-B1: 
Name                    Value 
----------------------  -------------- 
battery-fully-charged   true 
battery-test-result     passed 
battery-time-remaining  65535 
family-fru-id           0x0015000e 
marker-led              off 
on-battery              false 
operational-status      online 
part-number             078-000-123-05 
revision-number         FFF 
serial-number           ACPTxxxxxx1075

2)「battery-status」が「fully-charged」と表示され、「operational-status」が
    「online」と表示される場合、この問題を無視できます。このアラートは、
    コードのFRUモニター部分でFRUの状態のチェックを実行しているときにバッテリー テストが実行されたこと
     から、偽陽性であると考えられます。
 
3)「battery-status」が「charging」と表示され、「operational-status」が「online」と表示される場合
     バッテリー テストがまだ進行中の可能性のある場合は、約5分後にもう一度確認してください。5分後にも
     同じステータスが表示されている場合は、https://onlinesupport.emc.com/LiveChatから
      サポートとのライブ チャットを開始し、EMCカスタマー サポートに問い合わせて支援を依頼し、表示される手順に従ってください。 
 
4)「battery-status」が「charging」と表示され、「operational-status」が「offline」または
      「failure」と表示される場合、問題を示している可能性があります。さらに支援が必要な場合は、https://onlinesupport.emc.com/LiveChatから
      サポートとのライブ チャットを開始し、EMCカスタマー サポートに問い合わせて、表示される手順に従ってください。 

 

プライマリー製品:

VPLEXシリーズ

 

製品:

VPLEX VS6、VPLEX GeoSynchrony 6.0、VPLEX GeoSynchrony 6.1、VPLEXシリーズ、VPLEX GeoSynchrony、VPLEX Local、VPLEX Metro、VPLEX GeoSynchrony 6.0 Service Pack 1パッチ7、VPLEX GeoSynchrony 6.0 Service Pack 1パッチ6、VPLEX GeoSynchrony 6.0 Service Pack 1パッチ5、VPLEX GeoSynchrony 6.0 Service Pack 1パッチ4、VPLEX GeoSynchrony 6.0 Service Pack 1パッチ2、VPLEX GeoSynchrony 6.0 Service Pack 1パッチ1、VPLEX GeoSynchrony 6.0 Service Pack 1、VPLEX GeoSynchrony 6.0パッチ2、VPLEX GeoSynchrony 6.0パッチ1

 

エラー コード:

0x8a4861d7、0x8a4861d6

バージョン履歴
改訂番号
1/1
最終更新:
‎08-13-2020 02:29 PM
更新者:
 
寄稿者: