RHEL(RedHat Enterprise Linux) 및 PowerEdge의 'messages' 로그 EDAC 오류

概要: 이 문서에서는 RHEL(RedHat Enterprise Linux)의 'messages' 로그 EDAC 오류 문제에 대한 정보를 제공합니다.

この記事は次に適用されます: この記事は次には適用されません: この記事は、特定の製品に関連付けられていません。 すべての製品パージョンがこの記事に記載されているわけではありません。

現象

문제: 

'/var/log/messages' 로그에 다음과 같은 내용이 표시될 수 있습니다.
 

Sep 22 17:58:47 hostname kernel: EDAC MC0: CE 행 0, 채널 0, 레이블 "CPU_SrcID#0_Channel#1_DIMM#0": 1 알 수 없는 오류: 치명적 영역에서 메모리 스크러빙: cpu=0 Err=0008:00c2(ch=2), addr = 0x1b63f5000 => 소켓=0, Channel=1(mask=2), rank=0Sep
22 17:58:47 hostname kernel:
9월 22일 17:58:47 호스트 이름 커널: EDAC MC0: CE 행 1, 채널 0, 레이블 "CPU_SrcID#0_Channel#2_DIMM#0": 1 알 수 없는 오류: 치명적인 영역에서 메모리 스크러빙: cpu=0 Err=0008:00c2(ch=2), addr = 0x1b63f6000 => socket=0, Channel=2(mask=4), rank=0Sep
22 17:58:47 hostname kernel:
9월 22일 17:58:47 호스트 이름 커널: EDAC MC0: CE 행 1, 채널 0, 레이블 "CPU_SrcID#0_Channel#2_DIMM#0": 1 알 수 없는 오류: 치명적인 영역에서 메모리 스크러빙: cpu=0 Err=0008:00c2(ch=2), addr = 0x1b63f6000 => socket=0, Channel=2(mask=4), rank=0Sep
22 17:58:47 hostname kernel:
9월 22일 17:58:47 호스트 이름 커널: EDAC MC0: CE 행 2, 채널 0, 레이블 "CPU_SrcID#0_Channel#3_DIMM#0": 1 알 수 없는 오류: 치명적인 영역에서 메모리 스크러빙: cpu=0 Err=0008:00c2(ch=2), addr = 0x1b63f7000 => socket=0, Channel=3(mask=8), rank=0Sep
22 17:58:47 hostname kernel:
9월 22일 17:58:47 호스트 이름 커널: EDAC MC0: CE 행 0, 채널 0, 레이블 "CPU_SrcID#0_Channel#1_DIMM#0": 1 알 수 없는 오류: 치명적인 영역에서 메모리 스크러빙: cpu=0 Err=0008:00c2(ch=2), addr = 0x1b63f8000 => socket=0, Channel=1(mask=2), rank=0Sep
22 17:58:47 hostname kernel:
9월 22일 18:00:08 호스트 이름 커널: sbridge: MCE 메모리 오류
처리 22년 9월 22일 18:00:08 호스트 이름 커널: CPU 0: 시스템 검사 예외: 0 Bank 10: 8c00004d000800c2Sep
22 18:00:08 호스트 이름 커널: TSC 0 ADDR 2763f4000 MISC 90000080081a8c 프로세서 0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 호스트 이름 커널: sbridge: MCE 메모리 오류
처리 22년 9월 22일 18:00:08 호스트 이름 커널: CPU 0: 시스템 검사 예외: 0 Bank 10: 8c00004d000800c2Sep
22 18:00:08 호스트 이름 커널: TSC 0 ADDR 2763f4000 MISC 9000020002001a8c 프로세서 0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 호스트 이름 커널: sbridge: MCE 메모리 오류
처리 22년 9월 22일 18:00:08 호스트 이름 커널: CPU 0: 시스템 검사 예외: 0 Bank 10: 8c00004d000800c2Sep
22 18:00:08 호스트 이름 커널: TSC 0 ADDR 2763f4000 MISC 90000040041a8c 프로세서 0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 호스트 이름 커널: sbridge: MCE 메모리 오류
처리 22년 9월 22일 18:00:08 호스트 이름 커널: CPU 0: 시스템 검사 예외: 0 Bank 10: 8c00004d000800c2Sep
22 18:00:08 호스트 이름 커널: TSC 0 ADDR 2763f4000 MISC 90000040041a8c 프로세서 0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 호스트 이름 커널: sbridge: MCE 메모리 오류
처리 22년 9월 22일 18:00:08 호스트 이름 커널: CPU 0: 시스템 검사 예외: 0 Bank 10: 8c00004d000800c2Sep
22 18:00:08 호스트 이름 커널: TSC 0 ADDR 2763f5000 MISC 900001000101a8c 프로세서 0:206d7 시간 1379887208 소켓 0 APIC 0

 

原因

설명:
 
이러한 오류는 EDAC(Error Detection and Correction) 모듈이 칩셋에서 레지스터를 읽을 때 발생합니다. 레지스터는 한 번만 읽히고 활성화될 때 EDAC에서 먼저 가져오므로 ESM/BMC/IPMI/iDRAC 로그에서 메모리 또는 CPU 오류를 발견하지 못할 수도 있습니다.

 

解決方法

해결 방법:

 

  • edac 드라이버 차단 목록 작성:
    • edac 모듈 나열:
      • # lsmod | grep -i edac
    • 출력 확보 및 차단 목록 작성
    • 자신이 원하는 편집기로 '/etc/modprobe.d/blacklist.conf' 편집
    • 파일 하단에 모듈 추가
    • 예:
      • blacklist i7core_edac
      • blacklist edac_core
  • 재부팅
  • 하드웨어 진단 실행

 

対象製品

Servers, PowerEdge, Software RAID with Red Hat Enterprise Linux4, Red Hat Enterprise Linux Version 5, Red Hat Enterprise Linux Version 6, Red Hat Enterprise Linux Version 7, Red Hat Enterprise Virtualization 3
文書のプロパティ
文書番号: 000177028
文書の種類: Solution
最終更新: 04 2月 2025
バージョン:  8
質問に対する他のDellユーザーからの回答を見つける
サポート サービス
お使いのデバイスがサポート サービスの対象かどうかを確認してください。