「PowerEdge:CTL137イベントの概要とトラブルシューティング方法
概要: CTL137イベントは、iDRACコード4.xx.xx.xxの新機能です。CTL137イベントは、iDRACがシステム内のエンドポイント デバイスとの通信を失ったことをエンド ユーザーに通知するために存在します。
現象
とは CTL137 イベント?
この CTL137 イベントは、iDRACコード4.xx.xx.xxに新しく追加されました。「 CTL137 イベントは、iDRACとシステム内のエンドポイント デバイスとの通信が切れたことをエンド ユーザーに通知するために存在します。
例:
"ベイXのスロットXにあるストレージ コントローラーPCIe SSDは、 BMC ストレージ コントローラーまたは BMC 内部エラーのため、またはバスがエラー状態であるため、コマンドに応答していません。」
原因
何がトリガーされるのか CTL137 イベント.
iDRACは、エンドポイント デバイス(NVMeドライブ、PERCなど)を i2C さまざまな理由(正常性ステータスの変更、温度など)によるシステム内のチャネル。エンドポイント デバイスが10回連続して i2C ポーリングが発生した場合、iDRACは CTL137 イベント。iDRACがエンドポイント デバイスとの通信を失ったことをエンド ユーザーに通知するには
通信が回復すると、iDRACから通知されますか
エンドポイント デバイスへのi2C通信が CTL137 が生成されます。観察 CTL138 エンドポイント デバイスとの通信が復元されたことをユーザーに通知します。
例:「
」CTL138 ベイXのスロットXにあるストレージ コントローラーPCIe SSDとBMCの間の通信が復元されます」
iDRACをリセットすると問題が一時的に解決するのはなぜですか。
iDRACのリセットを実行すると、接続されているエンドポイント デバイスのインベントリーが強制的に再実行されることになります。また、このプロセスでは、各エンドポイント デバイスのiDRACコマンド失敗カウンターが、各エンドポイント デバイスに対して0にリセットされます。エンドポイント デバイスが10回連続して応答しなくなると i2C ポーリング後、iDRACは CTL137 イベントが発生します。
なぜ CTL137 イベントが発生し、ドライブはオペレーティングシステムOS内で引き続きオンラインです。
状況によっては、OS内でドライブがまだオンラインになっている場合があります。 CTL137 イベント。これは、 i2C ドライブへの通信は、データ ケーブルを経由しません。iDRACは、すべてのSMBus通信を1つの SIG マザーボードからバックプレーンに接続するケーブル。これらのコンポーネントに問題がある可能性があります。
解決方法
このような画面が表示された場合に確認するべきこと CTL137 イベント。
- ドライブが応答に失敗した可能性がある明白な理由を探します
i2CiDRACからのポーリング。- ドライブに障害が発生しましたか?
- PCIeリンク トレーニングの失敗
- PCIダウン トレイン エラー
- システム(NVMeドライブ、バックプレーン、iDRAC)内のすべてのコンポーネントが最新のコードであることを確認します。
- 手順1と2を実行しても、CTL137イベントが繰り返し表示される場合は、
CTL138イベント。その後、iDRACとエンドポイント デバイスの間で断続的な信号の問題が発生している可能性があります。- ドライブまたはバックプレーンのケーブルをプレーナーに抜き差ししてみます。