RedHat Enterprise Linux(RHEL)およびPowerEdgeRedの「messages」ログに発生するEDACエラー

요약: この文書では、RedHat Enterprise Linux(RHEL)の「messages」ログに発生するEDACエラーに関する問題について説明します。

이 문서는 다음에 적용됩니다. 이 문서는 다음에 적용되지 않습니다. 이 문서는 특정 제품과 관련이 없습니다. 모든 제품 버전이 이 문서에 나와 있는 것은 아닙니다.

증상

現象:

「/var/log/messages」ログに次のような内容が表示されることがあります。
 

Sep 22 17:58:47 hostname kernel: EDAC MC0: CE行0、チャネル0、ラベル「CPU_SrcID#0_Channel#1_DIMM#0」: 1 不明なエラー: FATAL領域でのメモリー スクラブ :cpu=0 Err=0008:00c2(ch=2)、addr = 0x1b63f5000 => socket=0、Channel=1(mask=2)、rank=0Sep
22 17:58:47 hostname kernel:
Sep 22 17:58:47 hostname kernel: EDAC MC0: CE行1、チャネル0、ラベル「CPU_SrcID#0_Channel#2_DIMM#0」: 1 不明なエラー: FATAL領域でのメモリー スクラブ :cpu=0 Err=0008:00c2(ch=2)、addr = 0x1b63f6000 => socket=0、Channel=2(mask=4)、rank=0Sep
22 17:58:47 hostname kernel:
Sep 22 17:58:47 hostname kernel: EDAC MC0: CE行1、チャネル0、ラベル「CPU_SrcID#0_Channel#2_DIMM#0」: 1 不明なエラー: FATAL領域でのメモリー スクラブ :cpu=0 Err=0008:00c2(ch=2)、addr = 0x1b63f6000 => socket=0、Channel=2(mask=4)、rank=0Sep
22 17:58:47 hostname kernel:
Sep 22 17:58:47 hostname kernel: EDAC MC0: CE行2、チャネル0、「CPU_SrcID#0_Channel#3_DIMM#0」というラベルを付けます。1 不明なエラー:致命的領域でのメモリー スクラブ:cpu=0 Err=0008:00c2(ch=2)、addr = 0x1b63f7000 => socket=0、Channel=3(mask=8)、rank=0Sep
22 17:58:47 hostname kernel:
Sep 22 17:58:47 hostname kernel: EDAC MC0: CE行0、チャネル0、ラベル「CPU_SrcID#0_Channel#1_DIMM#0」: 1 不明なエラー:FATAL領域でのメモリー スクラブ:cpu=0 Err=0008:00c2(ch=2)、addr = 0x1b63f8000 => socket=0、 Channel=1(mask=2), rank=0Sep
22 17:58:47 hostname kernel:
Sep 22 18:00:08 hostname kernel: sbridge: MCEメモリー エラー
の処理 22 18:00:08ホスト名カーネル: CPU 0: マシン チェック例外: 0 Bank 10: 8c00004d000800c2Sep 22
18:00:08ホスト名カーネル: TSC 0 ADDR 2763f4000 MISC 90000080081a8cプロセッサー0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 hostname kernel: sbridge: MCEメモリー エラー
の処理 22 18:00:08ホスト名カーネル: CPU 0: マシン チェック例外: 0 Bank 10: 8c00004d000800c2Sep 22
18:00:08ホスト名カーネル: TSC 0 ADDR 2763f4000 MISC 900002000201a8cプロセッサー0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 hostname kernel: sbridge: MCEメモリー エラー
の処理 22 18:00:08ホスト名カーネル: CPU 0: マシン チェック例外: 0 Bank 10: 8c00004d000800c2Sep 22
18:00:08ホスト名カーネル: TSC 0 ADDR 2763f4000 MISC 900000400041a8cプロセッサー0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 hostname kernel: sbridge: MCEメモリー エラー
の処理 22 18:00:08ホスト名カーネル: CPU 0: マシン チェック例外: 0 Bank 10: 8c00004d000800c2Sep 22
18:00:08ホスト名カーネル: TSC 0 ADDR 2763f4000 MISC 900000400041a8cプロセッサー0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 hostname kernel: sbridge: MCEメモリー エラー
の処理 22 18:00:08ホスト名カーネル: CPU 0: マシン チェック例外: 0 Bank 10: 8c00004d000800c2Sep 22
18:00:08ホスト名カーネル: TSC 0 ADDR 2763f5000その他900001000101a8cプロセッサー0:206d7 TIME 1379887208 SOCKET 0 APIC 0

 

원인

ディスカッション:

これらのエラーは、エラー検出および修正(EDAC)モジュールがチップセットからレジスターを読み取ったときに発生します。ESM/BMC/IPMI/iDRACログではメモリーまたはCPUのエラーは見られない可能性があります。これは、レジスターは1回だけ読み取られ、有効になると、EDACが最初にそれらを取得するためです。

 

해결

解決策:

 

  • 以下の手順を実行して、edacドライバーをブラックリストに追加します。
    • edacモジュールを一覧表示します。
      • # lsmod | grep -i edac
    • 出力結果をブラックリストに追加します。
    • 任意のエディターを使用して「/etc/modprobe.d/blacklist.conf」を編集します。
    • モジュールをファイル末尾に追加します。
    • 例:
      • blacklist i7core_edac
      • blacklist edac_core
  • 再起動
  • ハードウェアDiagnostics(診断)の実行

 

해당 제품

Servers, PowerEdge, Software RAID with Red Hat Enterprise Linux4, Red Hat Enterprise Linux Version 5, Red Hat Enterprise Linux Version 6, Red Hat Enterprise Linux Version 7, Red Hat Enterprise Virtualization 3
문서 속성
문서 번호: 000177028
문서 유형: Solution
마지막 수정 시간: 04 2월 2025
버전:  8
다른 Dell 사용자에게 질문에 대한 답변 찾기
지원 서비스
디바이스에 지원 서비스가 적용되는지 확인하십시오.