RHEL(RedHat Enterprise Linux) 및 PowerEdge의 'messages' 로그 EDAC 오류

Yhteenveto: 이 문서에서는 RHEL(RedHat Enterprise Linux)의 'messages' 로그 EDAC 오류 문제에 대한 정보를 제공합니다.

Tämä artikkeli koskee tuotetta Tämä artikkeli ei koske tuotetta Tämä artikkeli ei liity tiettyyn tuotteeseen. Tässä artikkelissa ei yksilöidä kaikkia tuoteversioita.

Oireet

문제: 

'/var/log/messages' 로그에 다음과 같은 내용이 표시될 수 있습니다.
 

Sep 22 17:58:47 hostname kernel: EDAC MC0: CE 행 0, 채널 0, 레이블 "CPU_SrcID#0_Channel#1_DIMM#0": 1 알 수 없는 오류: 치명적 영역에서 메모리 스크러빙: cpu=0 Err=0008:00c2(ch=2), addr = 0x1b63f5000 => 소켓=0, Channel=1(mask=2), rank=0Sep
22 17:58:47 hostname kernel:
9월 22일 17:58:47 호스트 이름 커널: EDAC MC0: CE 행 1, 채널 0, 레이블 "CPU_SrcID#0_Channel#2_DIMM#0": 1 알 수 없는 오류: 치명적인 영역에서 메모리 스크러빙: cpu=0 Err=0008:00c2(ch=2), addr = 0x1b63f6000 => socket=0, Channel=2(mask=4), rank=0Sep
22 17:58:47 hostname kernel:
9월 22일 17:58:47 호스트 이름 커널: EDAC MC0: CE 행 1, 채널 0, 레이블 "CPU_SrcID#0_Channel#2_DIMM#0": 1 알 수 없는 오류: 치명적인 영역에서 메모리 스크러빙: cpu=0 Err=0008:00c2(ch=2), addr = 0x1b63f6000 => socket=0, Channel=2(mask=4), rank=0Sep
22 17:58:47 hostname kernel:
9월 22일 17:58:47 호스트 이름 커널: EDAC MC0: CE 행 2, 채널 0, 레이블 "CPU_SrcID#0_Channel#3_DIMM#0": 1 알 수 없는 오류: 치명적인 영역에서 메모리 스크러빙: cpu=0 Err=0008:00c2(ch=2), addr = 0x1b63f7000 => socket=0, Channel=3(mask=8), rank=0Sep
22 17:58:47 hostname kernel:
9월 22일 17:58:47 호스트 이름 커널: EDAC MC0: CE 행 0, 채널 0, 레이블 "CPU_SrcID#0_Channel#1_DIMM#0": 1 알 수 없는 오류: 치명적인 영역에서 메모리 스크러빙: cpu=0 Err=0008:00c2(ch=2), addr = 0x1b63f8000 => socket=0, Channel=1(mask=2), rank=0Sep
22 17:58:47 hostname kernel:
9월 22일 18:00:08 호스트 이름 커널: sbridge: MCE 메모리 오류
처리 22년 9월 22일 18:00:08 호스트 이름 커널: CPU 0: 시스템 검사 예외: 0 Bank 10: 8c00004d000800c2Sep
22 18:00:08 호스트 이름 커널: TSC 0 ADDR 2763f4000 MISC 90000080081a8c 프로세서 0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 호스트 이름 커널: sbridge: MCE 메모리 오류
처리 22년 9월 22일 18:00:08 호스트 이름 커널: CPU 0: 시스템 검사 예외: 0 Bank 10: 8c00004d000800c2Sep
22 18:00:08 호스트 이름 커널: TSC 0 ADDR 2763f4000 MISC 9000020002001a8c 프로세서 0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 호스트 이름 커널: sbridge: MCE 메모리 오류
처리 22년 9월 22일 18:00:08 호스트 이름 커널: CPU 0: 시스템 검사 예외: 0 Bank 10: 8c00004d000800c2Sep
22 18:00:08 호스트 이름 커널: TSC 0 ADDR 2763f4000 MISC 90000040041a8c 프로세서 0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 호스트 이름 커널: sbridge: MCE 메모리 오류
처리 22년 9월 22일 18:00:08 호스트 이름 커널: CPU 0: 시스템 검사 예외: 0 Bank 10: 8c00004d000800c2Sep
22 18:00:08 호스트 이름 커널: TSC 0 ADDR 2763f4000 MISC 90000040041a8c 프로세서 0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 호스트 이름 커널: sbridge: MCE 메모리 오류
처리 22년 9월 22일 18:00:08 호스트 이름 커널: CPU 0: 시스템 검사 예외: 0 Bank 10: 8c00004d000800c2Sep
22 18:00:08 호스트 이름 커널: TSC 0 ADDR 2763f5000 MISC 900001000101a8c 프로세서 0:206d7 시간 1379887208 소켓 0 APIC 0

 

Syy

설명:
 
이러한 오류는 EDAC(Error Detection and Correction) 모듈이 칩셋에서 레지스터를 읽을 때 발생합니다. 레지스터는 한 번만 읽히고 활성화될 때 EDAC에서 먼저 가져오므로 ESM/BMC/IPMI/iDRAC 로그에서 메모리 또는 CPU 오류를 발견하지 못할 수도 있습니다.

 

Tarkkuus

해결 방법:

 

  • edac 드라이버 차단 목록 작성:
    • edac 모듈 나열:
      • # lsmod | grep -i edac
    • 출력 확보 및 차단 목록 작성
    • 자신이 원하는 편집기로 '/etc/modprobe.d/blacklist.conf' 편집
    • 파일 하단에 모듈 추가
    • 예:
      • blacklist i7core_edac
      • blacklist edac_core
  • 재부팅
  • 하드웨어 진단 실행

 

Tuotteet, joihin vaikutus kohdistuu

Servers, PowerEdge, Software RAID with Red Hat Enterprise Linux4, Red Hat Enterprise Linux Version 5, Red Hat Enterprise Linux Version 6, Red Hat Enterprise Linux Version 7, Red Hat Enterprise Virtualization 3
Artikkelin ominaisuudet
Artikkelin numero: 000177028
Artikkelin tyyppi: Solution
Viimeksi muutettu: 04 helmik. 2025
Versio:  8
Etsi vastauksia kysymyksiisi muilta Dell-käyttäjiltä
Tukipalvelut
Tarkista, kuuluuko laitteesi tukipalveluiden piiriin.