Zu den Hauptinhalten
  • Bestellungen schnell und einfach aufgeben
  • Bestellungen anzeigen und den Versandstatus verfolgen
  • Profitieren Sie von exklusiven Prämien und Rabatten für Mitglieder
  • Erstellen Sie eine Liste Ihrer Produkte, auf die Sie jederzeit zugreifen können.
  • Verwalten Sie mit der Unternehmensverwaltung Ihre Dell EMC Seiten, Produkte und produktspezifischen Kontakte.

RedHat Enterprise Linux (RHEL) 和 PowerEdge 上的 'messages’ 日志中的 EDAC 错误

Zusammenfassung: 本文提供了有关在 RedHat Enterprise Linux (RHEL) 中的 'messages' 日志中的 EDAC 错误的信息。

Dieser Artikel wurde möglicherweise automatisch übersetzt. Wenn Sie eine Rückmeldung bezüglich dessen Qualität geben möchten, teilen Sie uns diese über das Formular unten auf dieser Seite mit.

Artikelinhalt


Symptome

问题:

您可能会在 '/var/log/messages' 日志中看到以下类似内容:
 

Sep 22 17:58:47 hostname kernel: EDAC MC0:CE 行 0,通道 0,标签“CPU_SrcID#0_Channel#1_DIMM#0”:1 未知错误:致命区域上的内存清理:cpu=0 Err=0008:00c2 (ch=2),addr = 0x1b63f5000 => 插槽=0, Channel=1(mask=2),rank=0Sep
22 17:58:47 hostname kernel:
Sep 22 17:58:47 hostname kernel:EDAC MC0:CE 行 1,通道 0,标签“CPU_SrcID#0_Channel#2_DIMM#0”:1 未知错误:致命区域上的内存清理:cpu=0 Err=0008:00c2 (ch=2),addr = 0x1b63f6000 => 插槽=0, 通道 =2(mask=4),rank=0Sep
22 17:58:47 主机名内核:
9 月 22 日 17:58:47 主机名内核:EDAC MC0:CE 行 1,通道 0,标签“CPU_SrcID#0_Channel#2_DIMM#0”:1 未知错误:致命区域上的内存清理:cpu=0 Err=0008:00c2 (ch=2),addr = 0x1b63f6000 => 插槽=0, 通道 =2(mask=4),rank=0Sep
22 17:58:47 主机名内核:
9 月 22 日 17:58:47 主机名内核:EDAC MC0:CE 行 2,通道 0,标签“CPU_SrcID#0_Channel#3_DIMM#0”:1 未知错误:致命区域上的内存清理:cpu=0 Err=0008:00c2 (ch=2),addr = 0x1b63f7000 => 插槽=0, 通道 =3(mask=8),rank=0Sep
22 17:58:47 主机名内核:
9 月 22 日 17:58:47 主机名内核:EDAC MC0:CE 行 0,通道 0,标签“CPU_SrcID#0_Channel#1_DIMM#0”:1 未知错误:致命区域上的内存清理:cpu=0 Err=0008:00c2 (ch=2),addr = 0x1b63f8000 => 插槽=0, Channel=1(mask=2),rank=0Sep
22 17:58:47 hostname kernel:
Sep 22 18:00:08 hostname kernel: sbridge:处理 MCE 内存错误
22 18:00:08 主机名内核:CPU 0:机器检查异常:0 Bank 10:8c00004d000800c2Sep
22 18:00:08 主机名内核:TSC 0 ADDR 2763f4000 MISC 900000800081a8c 处理器 0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 主机名内核:sbridge:处理 MCE 内存错误
22 18:00:08 主机名内核:CPU 0:机器检查异常:0 Bank 10:8c00004d000800c2Sep
22 18:00:08 主机名内核:TSC 0 ADDR 2763f4000 MISC 900002000201a8c 处理器 0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 主机名内核:sbridge:处理 MCE 内存错误
22 18:00:08 主机名内核:CPU 0:机器检查异常:0 Bank 10:8c00004d000800c2Sep
22 18:00:08 主机名内核:TSC 0 ADDR 2763f4000 MISC 900000400041a8c 处理器 0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 主机名内核:sbridge:处理 MCE 内存错误
22 18:00:08 主机名内核:CPU 0:机器检查异常:0 Bank 10:8c00004d000800c2Sep
22 18:00:08 主机名内核:TSC 0 ADDR 2763f4000 MISC 900000400041a8c 处理器 0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 主机名内核:sbridge:处理 MCE 内存错误
22 18:00:08 主机名内核:CPU 0:机器检查异常:0 Bank 10:8c00004d000800c2Sep
22 18:00:08 主机名内核:TSC 0 ADDR 2763f5000 MISC 9000010001a8c 处理器 0:206d7 时间1379887208插槽 0 APIC 0

 

Ursache

讨论:

当错误检测和纠正 (EDAC) 模块从芯片组读取寄存器时,就会出现这些错误。您可能不会在 ESM/BMC/IPMI/iDRAC 日志中看到任何内存或 CPU 错误,因为寄存器为只读,并且在启用后,EDAC 将首先获得它们。

 

Lösung

解决方案:

 

  • 将 edac 驱动程序列入黑名单:
    • 列出 edac 模块:
      • # lsmod | grep -i edac
    • 获取输出并将其列入黑名单:
    • 使用您喜欢的编辑器来编辑 '/etc/modprobe.d/blacklist.conf'
    • 将模块添加到文件底部
    • 示例:
      • blacklist i7core_edac
      • blacklist edac_core
  • 重新 启动
  • 运行硬件诊断程序

 

Artikeleigenschaften


Betroffenes Produkt

Servers, PowerEdge, Software RAID with Red Hat Enterprise Linux4, Red Hat Enterprise Linux Version 5, Red Hat Enterprise Linux Version 6, Red Hat Enterprise Linux Version 7, Red Hat Enterprise Virtualization 3

Letztes Veröffentlichungsdatum

03 Feb. 2022

Version

5

Artikeltyp

Solution