RHEL(RedHat Enterprise Linux) 및 PowerEdge의 'messages' 로그 EDAC 오류

Resumen: 이 문서에서는 RHEL(RedHat Enterprise Linux)의 'messages' 로그 EDAC 오류 문제에 대한 정보를 제공합니다.

Este artículo se aplica a Este artículo no se aplica a Este artículo no está vinculado a ningún producto específico. No se identifican todas las versiones del producto en este artículo.

Síntomas

문제: 

'/var/log/messages' 로그에 다음과 같은 내용이 표시될 수 있습니다.
 

Sep 22 17:58:47 hostname kernel: EDAC MC0: CE 행 0, 채널 0, 레이블 "CPU_SrcID#0_Channel#1_DIMM#0": 1 알 수 없는 오류: 치명적 영역에서 메모리 스크러빙: cpu=0 Err=0008:00c2(ch=2), addr = 0x1b63f5000 => 소켓=0, Channel=1(mask=2), rank=0Sep
22 17:58:47 hostname kernel:
9월 22일 17:58:47 호스트 이름 커널: EDAC MC0: CE 행 1, 채널 0, 레이블 "CPU_SrcID#0_Channel#2_DIMM#0": 1 알 수 없는 오류: 치명적인 영역에서 메모리 스크러빙: cpu=0 Err=0008:00c2(ch=2), addr = 0x1b63f6000 => socket=0, Channel=2(mask=4), rank=0Sep
22 17:58:47 hostname kernel:
9월 22일 17:58:47 호스트 이름 커널: EDAC MC0: CE 행 1, 채널 0, 레이블 "CPU_SrcID#0_Channel#2_DIMM#0": 1 알 수 없는 오류: 치명적인 영역에서 메모리 스크러빙: cpu=0 Err=0008:00c2(ch=2), addr = 0x1b63f6000 => socket=0, Channel=2(mask=4), rank=0Sep
22 17:58:47 hostname kernel:
9월 22일 17:58:47 호스트 이름 커널: EDAC MC0: CE 행 2, 채널 0, 레이블 "CPU_SrcID#0_Channel#3_DIMM#0": 1 알 수 없는 오류: 치명적인 영역에서 메모리 스크러빙: cpu=0 Err=0008:00c2(ch=2), addr = 0x1b63f7000 => socket=0, Channel=3(mask=8), rank=0Sep
22 17:58:47 hostname kernel:
9월 22일 17:58:47 호스트 이름 커널: EDAC MC0: CE 행 0, 채널 0, 레이블 "CPU_SrcID#0_Channel#1_DIMM#0": 1 알 수 없는 오류: 치명적인 영역에서 메모리 스크러빙: cpu=0 Err=0008:00c2(ch=2), addr = 0x1b63f8000 => socket=0, Channel=1(mask=2), rank=0Sep
22 17:58:47 hostname kernel:
9월 22일 18:00:08 호스트 이름 커널: sbridge: MCE 메모리 오류
처리 22년 9월 22일 18:00:08 호스트 이름 커널: CPU 0: 시스템 검사 예외: 0 Bank 10: 8c00004d000800c2Sep
22 18:00:08 호스트 이름 커널: TSC 0 ADDR 2763f4000 MISC 90000080081a8c 프로세서 0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 호스트 이름 커널: sbridge: MCE 메모리 오류
처리 22년 9월 22일 18:00:08 호스트 이름 커널: CPU 0: 시스템 검사 예외: 0 Bank 10: 8c00004d000800c2Sep
22 18:00:08 호스트 이름 커널: TSC 0 ADDR 2763f4000 MISC 9000020002001a8c 프로세서 0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 호스트 이름 커널: sbridge: MCE 메모리 오류
처리 22년 9월 22일 18:00:08 호스트 이름 커널: CPU 0: 시스템 검사 예외: 0 Bank 10: 8c00004d000800c2Sep
22 18:00:08 호스트 이름 커널: TSC 0 ADDR 2763f4000 MISC 90000040041a8c 프로세서 0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 호스트 이름 커널: sbridge: MCE 메모리 오류
처리 22년 9월 22일 18:00:08 호스트 이름 커널: CPU 0: 시스템 검사 예외: 0 Bank 10: 8c00004d000800c2Sep
22 18:00:08 호스트 이름 커널: TSC 0 ADDR 2763f4000 MISC 90000040041a8c 프로세서 0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 호스트 이름 커널: sbridge: MCE 메모리 오류
처리 22년 9월 22일 18:00:08 호스트 이름 커널: CPU 0: 시스템 검사 예외: 0 Bank 10: 8c00004d000800c2Sep
22 18:00:08 호스트 이름 커널: TSC 0 ADDR 2763f5000 MISC 900001000101a8c 프로세서 0:206d7 시간 1379887208 소켓 0 APIC 0

 

Causa

설명:
 
이러한 오류는 EDAC(Error Detection and Correction) 모듈이 칩셋에서 레지스터를 읽을 때 발생합니다. 레지스터는 한 번만 읽히고 활성화될 때 EDAC에서 먼저 가져오므로 ESM/BMC/IPMI/iDRAC 로그에서 메모리 또는 CPU 오류를 발견하지 못할 수도 있습니다.

 

Resolución

해결 방법:

 

  • edac 드라이버 차단 목록 작성:
    • edac 모듈 나열:
      • # lsmod | grep -i edac
    • 출력 확보 및 차단 목록 작성
    • 자신이 원하는 편집기로 '/etc/modprobe.d/blacklist.conf' 편집
    • 파일 하단에 모듈 추가
    • 예:
      • blacklist i7core_edac
      • blacklist edac_core
  • 재부팅
  • 하드웨어 진단 실행

 

Productos afectados

Servers, PowerEdge, Software RAID with Red Hat Enterprise Linux4, Red Hat Enterprise Linux Version 5, Red Hat Enterprise Linux Version 6, Red Hat Enterprise Linux Version 7, Red Hat Enterprise Virtualization 3
Propiedades del artículo
Número del artículo: 000177028
Tipo de artículo: Solution
Última modificación: 04 feb 2025
Versión:  8
Encuentre respuestas a sus preguntas de otros usuarios de Dell
Servicios de soporte
Compruebe si el dispositivo está cubierto por los servicios de soporte.