Dlm:DLMV0198E エラー修正可能マシン チェック エラーのトラブルシューティング
Summary: DLmV0198Eアラートは、CPUセンサーのマシン チェックを通知し、中央処理装置(CPU)または先進プログラマブル割り込みコントローラー(APIC)の障害を示し、メモリーに影響を与える可能性があります。
Symptoms
DLmV0198E: Processor sensor CPUMachineCheck - Correctable machine check error (CPU 2 | APIC ID 32 ) Asserted
DLmV0198E: Processor sensor CPUMachineCheck - Correctable machine check error (CPU 1 | APIC ID 4 ) Asserted
その他
Cause
ハードウェア エラーが発行され、エラー メッセージDLmV0198Eでアラートが生成されます。
Resolution
それぞれのVTEシステムのイベント ログにエラーがないか確認する必要があります。DLmV0198Eエラー メッセージは一般的なものであり、実際の障害を明らかにするとは限りません。
RACADMを使用するか、VTEに接続してエラーを確認できます<
コマンド ラインまたはPuttyでユニットに接続できる場合は、次のコマンドを実行すると1つ以上のエラーが表示されます。
racadm getsel
または
ipmitool sel list
エラーはアラートと同じ日付のものです。
Record: 17 Date/Time: 03/08/2020 05:19:04 Source: system Severity: Critical Description: Correctable memory error logging disabled for a memory device at lo cation DIMM_B1.
上記の例は、メモリー カード(DIMM)エラーを示しています。
お客様: このアラート メッセージが通知された場合は、コール ホーム アラートがサポート サイト経由でDellに送信されたことを確認します。このエラーによってコール ホームが生成され、ケースがすでに作成されている場合は、Dellサポート スタッフがアラートをフォローアップします。通常、この種のコール ホーム アラートを受信するまでにかかる時間は1時間未満です
ユニットにアクセスできなくなった場合、またはDLmにテープが取り付けられていない場合は、すぐにDLmサポートにお問い合わせください。
サポート スタッフ: システム イベント ログから取得した情報を使用して、アラートのトラブルシューティングを行います。コマンド ラインに接続できない場合は、iDRACインターフェイスに接続して、ユニットの電源を入れ直すことができるかどうかを確認します。ユニットがiDRACコマンドに応答しない場合は、必要に応じてVTEを交換するためにフィールド リソースをオンサイトに派遣します。
ユニットにアクセスできる場合は、アラートのトラブルシューティングに必要な情報を収集します。