RedHat Enterprise Linux (RHEL) 和 PowerEdge 上的 'messages’ 日志中的 EDAC 错误

요약: 本文提供了有关在 RedHat Enterprise Linux (RHEL) 中的 'messages' 日志中的 EDAC 错误的信息。

이 문서는 다음에 적용됩니다. 이 문서는 다음에 적용되지 않습니다. 이 문서는 특정 제품과 관련이 없습니다. 모든 제품 버전이 이 문서에 나와 있는 것은 아닙니다.

증상

问题:

您可能会在 '/var/log/messages' 日志中看到以下类似内容:
 

Sep 22 17:58:47 hostname kernel: EDAC MC0:CE 行 0,通道 0,标签“CPU_SrcID#0_Channel#1_DIMM#0”:1 未知错误:致命区域上的内存清理:cpu=0 Err=0008:00c2 (ch=2),addr = 0x1b63f5000 => 插槽=0, Channel=1(mask=2),rank=0Sep
22 17:58:47 hostname kernel:
Sep 22 17:58:47 hostname kernel:EDAC MC0:CE 行 1,通道 0,标签“CPU_SrcID#0_Channel#2_DIMM#0”:1 未知错误:致命区域上的内存清理:cpu=0 Err=0008:00c2 (ch=2),addr = 0x1b63f6000 => 插槽=0, 通道 =2(mask=4),rank=0Sep
22 17:58:47 主机名内核:
9 月 22 日 17:58:47 主机名内核:EDAC MC0:CE 行 1,通道 0,标签“CPU_SrcID#0_Channel#2_DIMM#0”:1 未知错误:致命区域上的内存清理:cpu=0 Err=0008:00c2 (ch=2),addr = 0x1b63f6000 => 插槽=0, 通道 =2(mask=4),rank=0Sep
22 17:58:47 主机名内核:
9 月 22 日 17:58:47 主机名内核:EDAC MC0:CE 行 2,通道 0,标签“CPU_SrcID#0_Channel#3_DIMM#0”:1 未知错误:致命区域上的内存清理:cpu=0 Err=0008:00c2 (ch=2),addr = 0x1b63f7000 => 插槽=0, 通道 =3(mask=8),rank=0Sep
22 17:58:47 主机名内核:
9 月 22 日 17:58:47 主机名内核:EDAC MC0:CE 行 0,通道 0,标签“CPU_SrcID#0_Channel#1_DIMM#0”:1 未知错误:致命区域上的内存清理:cpu=0 Err=0008:00c2 (ch=2),addr = 0x1b63f8000 => 插槽=0, Channel=1(mask=2),rank=0Sep
22 17:58:47 hostname kernel:
Sep 22 18:00:08 hostname kernel: sbridge:处理 MCE 内存错误
22 18:00:08 主机名内核:CPU 0:机器检查异常:0 Bank 10:8c00004d000800c2Sep
22 18:00:08 主机名内核:TSC 0 ADDR 2763f4000 MISC 900000800081a8c 处理器 0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 主机名内核:sbridge:处理 MCE 内存错误
22 18:00:08 主机名内核:CPU 0:机器检查异常:0 Bank 10:8c00004d000800c2Sep
22 18:00:08 主机名内核:TSC 0 ADDR 2763f4000 MISC 900002000201a8c 处理器 0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 主机名内核:sbridge:处理 MCE 内存错误
22 18:00:08 主机名内核:CPU 0:机器检查异常:0 Bank 10:8c00004d000800c2Sep
22 18:00:08 主机名内核:TSC 0 ADDR 2763f4000 MISC 900000400041a8c 处理器 0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 主机名内核:sbridge:处理 MCE 内存错误
22 18:00:08 主机名内核:CPU 0:机器检查异常:0 Bank 10:8c00004d000800c2Sep
22 18:00:08 主机名内核:TSC 0 ADDR 2763f4000 MISC 900000400041a8c 处理器 0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 主机名内核:sbridge:处理 MCE 内存错误
22 18:00:08 主机名内核:CPU 0:机器检查异常:0 Bank 10:8c00004d000800c2Sep
22 18:00:08 主机名内核:TSC 0 ADDR 2763f5000 MISC 9000010001a8c 处理器 0:206d7 时间1379887208插槽 0 APIC 0

 

원인

讨论:

当错误检测和纠正 (EDAC) 模块从芯片组读取寄存器时,就会出现这些错误。您可能不会在 ESM/BMC/IPMI/iDRAC 日志中看到任何内存或 CPU 错误,因为寄存器为只读,并且在启用后,EDAC 将首先获得它们。

 

해결

解决方案:

 

  • 将 edac 驱动程序列入黑名单:
    • 列出 edac 模块:
      • # lsmod | grep -i edac
    • 获取输出并将其列入黑名单:
    • 使用您喜欢的编辑器来编辑 '/etc/modprobe.d/blacklist.conf'
    • 将模块添加到文件底部
    • 示例:
      • blacklist i7core_edac
      • blacklist edac_core
  • 重新 启动
  • 运行硬件诊断程序

 

해당 제품

Servers, PowerEdge, Software RAID with Red Hat Enterprise Linux4, Red Hat Enterprise Linux Version 5, Red Hat Enterprise Linux Version 6, Red Hat Enterprise Linux Version 7, Red Hat Enterprise Virtualization 3
문서 속성
문서 번호: 000177028
문서 유형: Solution
마지막 수정 시간: 04 2월 2025
버전:  8
다른 Dell 사용자에게 질문에 대한 답변 찾기
지원 서비스
디바이스에 지원 서비스가 적용되는지 확인하십시오.