RedHat Enterprise Linux (RHEL) 和 PowerEdge 上的 'messages’ 日志中的 EDAC 错误

Yhteenveto: 本文提供了有关在 RedHat Enterprise Linux (RHEL) 中的 'messages' 日志中的 EDAC 错误的信息。

Tämä artikkeli koskee tuotetta Tämä artikkeli ei koske tuotetta Tämä artikkeli ei liity tiettyyn tuotteeseen. Tässä artikkelissa ei yksilöidä kaikkia tuoteversioita.

Oireet

问题:

您可能会在 '/var/log/messages' 日志中看到以下类似内容:
 

Sep 22 17:58:47 hostname kernel: EDAC MC0:CE 行 0,通道 0,标签“CPU_SrcID#0_Channel#1_DIMM#0”:1 未知错误:致命区域上的内存清理:cpu=0 Err=0008:00c2 (ch=2),addr = 0x1b63f5000 => 插槽=0, Channel=1(mask=2),rank=0Sep
22 17:58:47 hostname kernel:
Sep 22 17:58:47 hostname kernel:EDAC MC0:CE 行 1,通道 0,标签“CPU_SrcID#0_Channel#2_DIMM#0”:1 未知错误:致命区域上的内存清理:cpu=0 Err=0008:00c2 (ch=2),addr = 0x1b63f6000 => 插槽=0, 通道 =2(mask=4),rank=0Sep
22 17:58:47 主机名内核:
9 月 22 日 17:58:47 主机名内核:EDAC MC0:CE 行 1,通道 0,标签“CPU_SrcID#0_Channel#2_DIMM#0”:1 未知错误:致命区域上的内存清理:cpu=0 Err=0008:00c2 (ch=2),addr = 0x1b63f6000 => 插槽=0, 通道 =2(mask=4),rank=0Sep
22 17:58:47 主机名内核:
9 月 22 日 17:58:47 主机名内核:EDAC MC0:CE 行 2,通道 0,标签“CPU_SrcID#0_Channel#3_DIMM#0”:1 未知错误:致命区域上的内存清理:cpu=0 Err=0008:00c2 (ch=2),addr = 0x1b63f7000 => 插槽=0, 通道 =3(mask=8),rank=0Sep
22 17:58:47 主机名内核:
9 月 22 日 17:58:47 主机名内核:EDAC MC0:CE 行 0,通道 0,标签“CPU_SrcID#0_Channel#1_DIMM#0”:1 未知错误:致命区域上的内存清理:cpu=0 Err=0008:00c2 (ch=2),addr = 0x1b63f8000 => 插槽=0, Channel=1(mask=2),rank=0Sep
22 17:58:47 hostname kernel:
Sep 22 18:00:08 hostname kernel: sbridge:处理 MCE 内存错误
22 18:00:08 主机名内核:CPU 0:机器检查异常:0 Bank 10:8c00004d000800c2Sep
22 18:00:08 主机名内核:TSC 0 ADDR 2763f4000 MISC 900000800081a8c 处理器 0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 主机名内核:sbridge:处理 MCE 内存错误
22 18:00:08 主机名内核:CPU 0:机器检查异常:0 Bank 10:8c00004d000800c2Sep
22 18:00:08 主机名内核:TSC 0 ADDR 2763f4000 MISC 900002000201a8c 处理器 0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 主机名内核:sbridge:处理 MCE 内存错误
22 18:00:08 主机名内核:CPU 0:机器检查异常:0 Bank 10:8c00004d000800c2Sep
22 18:00:08 主机名内核:TSC 0 ADDR 2763f4000 MISC 900000400041a8c 处理器 0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 主机名内核:sbridge:处理 MCE 内存错误
22 18:00:08 主机名内核:CPU 0:机器检查异常:0 Bank 10:8c00004d000800c2Sep
22 18:00:08 主机名内核:TSC 0 ADDR 2763f4000 MISC 900000400041a8c 处理器 0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 主机名内核:sbridge:处理 MCE 内存错误
22 18:00:08 主机名内核:CPU 0:机器检查异常:0 Bank 10:8c00004d000800c2Sep
22 18:00:08 主机名内核:TSC 0 ADDR 2763f5000 MISC 9000010001a8c 处理器 0:206d7 时间1379887208插槽 0 APIC 0

 

Syy

讨论:

当错误检测和纠正 (EDAC) 模块从芯片组读取寄存器时,就会出现这些错误。您可能不会在 ESM/BMC/IPMI/iDRAC 日志中看到任何内存或 CPU 错误,因为寄存器为只读,并且在启用后,EDAC 将首先获得它们。

 

Tarkkuus

解决方案:

 

  • 将 edac 驱动程序列入黑名单:
    • 列出 edac 模块:
      • # lsmod | grep -i edac
    • 获取输出并将其列入黑名单:
    • 使用您喜欢的编辑器来编辑 '/etc/modprobe.d/blacklist.conf'
    • 将模块添加到文件底部
    • 示例:
      • blacklist i7core_edac
      • blacklist edac_core
  • 重新 启动
  • 运行硬件诊断程序

 

Tuotteet, joihin vaikutus kohdistuu

Servers, PowerEdge, Software RAID with Red Hat Enterprise Linux4, Red Hat Enterprise Linux Version 5, Red Hat Enterprise Linux Version 6, Red Hat Enterprise Linux Version 7, Red Hat Enterprise Virtualization 3
Artikkelin ominaisuudet
Artikkelin numero: 000177028
Artikkelin tyyppi: Solution
Viimeksi muutettu: 04 helmik. 2025
Versio:  8
Etsi vastauksia kysymyksiisi muilta Dell-käyttäjiltä
Tukipalvelut
Tarkista, kuuluuko laitteesi tukipalveluiden piiriin.