RHEL(RedHat Enterprise Linux) 및 PowerEdge의 'messages' 로그 EDAC 오류

Shrnutí: 이 문서에서는 RHEL(RedHat Enterprise Linux)의 'messages' 로그 EDAC 오류 문제에 대한 정보를 제공합니다.

Tento článek se vztahuje na Tento článek se nevztahuje na Tento článek není vázán na žádný konkrétní produkt. V tomto článku nejsou uvedeny všechny verze produktu.

Příznaky

문제: 

'/var/log/messages' 로그에 다음과 같은 내용이 표시될 수 있습니다.
 

Sep 22 17:58:47 hostname kernel: EDAC MC0: CE 행 0, 채널 0, 레이블 "CPU_SrcID#0_Channel#1_DIMM#0": 1 알 수 없는 오류: 치명적 영역에서 메모리 스크러빙: cpu=0 Err=0008:00c2(ch=2), addr = 0x1b63f5000 => 소켓=0, Channel=1(mask=2), rank=0Sep
22 17:58:47 hostname kernel:
9월 22일 17:58:47 호스트 이름 커널: EDAC MC0: CE 행 1, 채널 0, 레이블 "CPU_SrcID#0_Channel#2_DIMM#0": 1 알 수 없는 오류: 치명적인 영역에서 메모리 스크러빙: cpu=0 Err=0008:00c2(ch=2), addr = 0x1b63f6000 => socket=0, Channel=2(mask=4), rank=0Sep
22 17:58:47 hostname kernel:
9월 22일 17:58:47 호스트 이름 커널: EDAC MC0: CE 행 1, 채널 0, 레이블 "CPU_SrcID#0_Channel#2_DIMM#0": 1 알 수 없는 오류: 치명적인 영역에서 메모리 스크러빙: cpu=0 Err=0008:00c2(ch=2), addr = 0x1b63f6000 => socket=0, Channel=2(mask=4), rank=0Sep
22 17:58:47 hostname kernel:
9월 22일 17:58:47 호스트 이름 커널: EDAC MC0: CE 행 2, 채널 0, 레이블 "CPU_SrcID#0_Channel#3_DIMM#0": 1 알 수 없는 오류: 치명적인 영역에서 메모리 스크러빙: cpu=0 Err=0008:00c2(ch=2), addr = 0x1b63f7000 => socket=0, Channel=3(mask=8), rank=0Sep
22 17:58:47 hostname kernel:
9월 22일 17:58:47 호스트 이름 커널: EDAC MC0: CE 행 0, 채널 0, 레이블 "CPU_SrcID#0_Channel#1_DIMM#0": 1 알 수 없는 오류: 치명적인 영역에서 메모리 스크러빙: cpu=0 Err=0008:00c2(ch=2), addr = 0x1b63f8000 => socket=0, Channel=1(mask=2), rank=0Sep
22 17:58:47 hostname kernel:
9월 22일 18:00:08 호스트 이름 커널: sbridge: MCE 메모리 오류
처리 22년 9월 22일 18:00:08 호스트 이름 커널: CPU 0: 시스템 검사 예외: 0 Bank 10: 8c00004d000800c2Sep
22 18:00:08 호스트 이름 커널: TSC 0 ADDR 2763f4000 MISC 90000080081a8c 프로세서 0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 호스트 이름 커널: sbridge: MCE 메모리 오류
처리 22년 9월 22일 18:00:08 호스트 이름 커널: CPU 0: 시스템 검사 예외: 0 Bank 10: 8c00004d000800c2Sep
22 18:00:08 호스트 이름 커널: TSC 0 ADDR 2763f4000 MISC 9000020002001a8c 프로세서 0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 호스트 이름 커널: sbridge: MCE 메모리 오류
처리 22년 9월 22일 18:00:08 호스트 이름 커널: CPU 0: 시스템 검사 예외: 0 Bank 10: 8c00004d000800c2Sep
22 18:00:08 호스트 이름 커널: TSC 0 ADDR 2763f4000 MISC 90000040041a8c 프로세서 0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 호스트 이름 커널: sbridge: MCE 메모리 오류
처리 22년 9월 22일 18:00:08 호스트 이름 커널: CPU 0: 시스템 검사 예외: 0 Bank 10: 8c00004d000800c2Sep
22 18:00:08 호스트 이름 커널: TSC 0 ADDR 2763f4000 MISC 90000040041a8c 프로세서 0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 호스트 이름 커널: sbridge: MCE 메모리 오류
처리 22년 9월 22일 18:00:08 호스트 이름 커널: CPU 0: 시스템 검사 예외: 0 Bank 10: 8c00004d000800c2Sep
22 18:00:08 호스트 이름 커널: TSC 0 ADDR 2763f5000 MISC 900001000101a8c 프로세서 0:206d7 시간 1379887208 소켓 0 APIC 0

 

Příčina

설명:
 
이러한 오류는 EDAC(Error Detection and Correction) 모듈이 칩셋에서 레지스터를 읽을 때 발생합니다. 레지스터는 한 번만 읽히고 활성화될 때 EDAC에서 먼저 가져오므로 ESM/BMC/IPMI/iDRAC 로그에서 메모리 또는 CPU 오류를 발견하지 못할 수도 있습니다.

 

Řešení

해결 방법:

 

  • edac 드라이버 차단 목록 작성:
    • edac 모듈 나열:
      • # lsmod | grep -i edac
    • 출력 확보 및 차단 목록 작성
    • 자신이 원하는 편집기로 '/etc/modprobe.d/blacklist.conf' 편집
    • 파일 하단에 모듈 추가
    • 예:
      • blacklist i7core_edac
      • blacklist edac_core
  • 재부팅
  • 하드웨어 진단 실행

 

Dotčené produkty

Servers, PowerEdge, Software RAID with Red Hat Enterprise Linux4, Red Hat Enterprise Linux Version 5, Red Hat Enterprise Linux Version 6, Red Hat Enterprise Linux Version 7, Red Hat Enterprise Virtualization 3
Vlastnosti článku
Číslo článku: 000177028
Typ článku: Solution
Poslední úprava: 04 úno 2025
Verze:  8
Najděte odpovědi na své otázky od ostatních uživatelů společnosti Dell
Služby podpory
Zkontrolujte, zda se na vaše zařízení vztahují služby podpory.