Skip to main content
  • Place orders quickly and easily
  • View orders and track your shipping status
  • Enjoy members-only rewards and discounts
  • Create and access a list of your products
  • Manage your Dell EMC sites, products, and product-level contacts using Company Administration.

RedHat Enterprise Linux (RHEL) 和 PowerEdge 上的 'messages’ 日志中的 EDAC 错误

Summary: 本文提供了有关在 RedHat Enterprise Linux (RHEL) 中的 'messages' 日志中的 EDAC 错误的信息。

This article may have been automatically translated. If you have any feedback regarding its quality, please let us know using the form at the bottom of this page.

Article Content


Symptoms

问题:

您可能会在 '/var/log/messages' 日志中看到以下类似内容:
 

Sep 22 17:58:47 hostname kernel: EDAC MC0:CE 行 0,通道 0,标签“CPU_SrcID#0_Channel#1_DIMM#0”:1 未知错误:致命区域上的内存清理:cpu=0 Err=0008:00c2 (ch=2),addr = 0x1b63f5000 => 插槽=0, Channel=1(mask=2),rank=0Sep
22 17:58:47 hostname kernel:
Sep 22 17:58:47 hostname kernel:EDAC MC0:CE 行 1,通道 0,标签“CPU_SrcID#0_Channel#2_DIMM#0”:1 未知错误:致命区域上的内存清理:cpu=0 Err=0008:00c2 (ch=2),addr = 0x1b63f6000 => 插槽=0, 通道 =2(mask=4),rank=0Sep
22 17:58:47 主机名内核:
9 月 22 日 17:58:47 主机名内核:EDAC MC0:CE 行 1,通道 0,标签“CPU_SrcID#0_Channel#2_DIMM#0”:1 未知错误:致命区域上的内存清理:cpu=0 Err=0008:00c2 (ch=2),addr = 0x1b63f6000 => 插槽=0, 通道 =2(mask=4),rank=0Sep
22 17:58:47 主机名内核:
9 月 22 日 17:58:47 主机名内核:EDAC MC0:CE 行 2,通道 0,标签“CPU_SrcID#0_Channel#3_DIMM#0”:1 未知错误:致命区域上的内存清理:cpu=0 Err=0008:00c2 (ch=2),addr = 0x1b63f7000 => 插槽=0, 通道 =3(mask=8),rank=0Sep
22 17:58:47 主机名内核:
9 月 22 日 17:58:47 主机名内核:EDAC MC0:CE 行 0,通道 0,标签“CPU_SrcID#0_Channel#1_DIMM#0”:1 未知错误:致命区域上的内存清理:cpu=0 Err=0008:00c2 (ch=2),addr = 0x1b63f8000 => 插槽=0, Channel=1(mask=2),rank=0Sep
22 17:58:47 hostname kernel:
Sep 22 18:00:08 hostname kernel: sbridge:处理 MCE 内存错误
22 18:00:08 主机名内核:CPU 0:机器检查异常:0 Bank 10:8c00004d000800c2Sep
22 18:00:08 主机名内核:TSC 0 ADDR 2763f4000 MISC 900000800081a8c 处理器 0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 主机名内核:sbridge:处理 MCE 内存错误
22 18:00:08 主机名内核:CPU 0:机器检查异常:0 Bank 10:8c00004d000800c2Sep
22 18:00:08 主机名内核:TSC 0 ADDR 2763f4000 MISC 900002000201a8c 处理器 0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 主机名内核:sbridge:处理 MCE 内存错误
22 18:00:08 主机名内核:CPU 0:机器检查异常:0 Bank 10:8c00004d000800c2Sep
22 18:00:08 主机名内核:TSC 0 ADDR 2763f4000 MISC 900000400041a8c 处理器 0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 主机名内核:sbridge:处理 MCE 内存错误
22 18:00:08 主机名内核:CPU 0:机器检查异常:0 Bank 10:8c00004d000800c2Sep
22 18:00:08 主机名内核:TSC 0 ADDR 2763f4000 MISC 900000400041a8c 处理器 0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 主机名内核:sbridge:处理 MCE 内存错误
22 18:00:08 主机名内核:CPU 0:机器检查异常:0 Bank 10:8c00004d000800c2Sep
22 18:00:08 主机名内核:TSC 0 ADDR 2763f5000 MISC 9000010001a8c 处理器 0:206d7 时间1379887208插槽 0 APIC 0

 

Cause

讨论:

当错误检测和纠正 (EDAC) 模块从芯片组读取寄存器时,就会出现这些错误。您可能不会在 ESM/BMC/IPMI/iDRAC 日志中看到任何内存或 CPU 错误,因为寄存器为只读,并且在启用后,EDAC 将首先获得它们。

 

Resolution

解决方案:

 

  • 将 edac 驱动程序列入黑名单:
    • 列出 edac 模块:
      • # lsmod | grep -i edac
    • 获取输出并将其列入黑名单:
    • 使用您喜欢的编辑器来编辑 '/etc/modprobe.d/blacklist.conf'
    • 将模块添加到文件底部
    • 示例:
      • blacklist i7core_edac
      • blacklist edac_core
  • 重新 启动
  • 运行硬件诊断程序

 

Article Properties


Affected Product

Servers, PowerEdge, Software RAID with Red Hat Enterprise Linux4, Red Hat Enterprise Linux Version 5, Red Hat Enterprise Linux Version 6, Red Hat Enterprise Linux Version 7, Red Hat Enterprise Virtualization 3

Last Published Date

03 Feb 2022

Version

5

Article Type

Solution