RedHat Enterprise Linux (RHEL) ve PowerEdge'de "mesajlar" günlüğündeki EDAC Hataları

摘要: Bu makalede, RedHat Enterprise Linux'taki (RHEL) "mesajlar" günlüğünde bulunan EDAC hataları hakkında bilgiler sağlanmaktadır.

本文适用于 本文不适用于 本文并非针对某种特定的产品。 本文并非包含所有产品版本。

症状

Sorun: 

"/var/log/messages" günlüğünüzde aşağıdakine benzer bir şey görebilirsiniz:
 

Sep 22 17:58:47 hostname kernel: EDAC MC0: CE satır 0, kanal 0, etiket "CPU_SrcID#0_Channel#1_DIMM#0": 1 Bilinmeyen hata(s): FATAL (FATAL) alanındaki bellek temizleme: cpu=0 Err=0008:00c2 (ch=2), addr = 0x1b63f5000 => socket=0, Kanal=1(maske=2), rank=0Sep
22 17:58:47 hostname kernel:
Sep 22 17:58:47 hostname kernel: EDAC MC0: CE satır 1, kanal 0, etiket "CPU_SrcID#0_Channel#2_DIMM#0": 1 Bilinmeyen hata(s): FATAL (FATAL) alanındaki bellek temizleme: cpu=0 Err=0008:00c2 (ch=2), addr = 0x1b63f6000 => socket=0, Channel=2(mask=4), rank=0Sep
22 17:58:47 hostname kernel:
Sep 22 17:58:47 hostname kernel: EDAC MC0: CE satır 1, kanal 0, etiket "CPU_SrcID#0_Channel#2_DIMM#0": 1 Bilinmeyen hata(s): FATAL (FATAL) alanındaki bellek temizleme: cpu=0 Err=0008:00c2 (ch=2), addr = 0x1b63f6000 => socket=0, Channel=2(mask=4), rank=0Sep
22 17:58:47 hostname kernel:
Sep 22 17:58:47 hostname kernel: EDAC MC0: CE satır 2, kanal 0, etiket "CPU_SrcID#0_Channel#3_DIMM#0": 1 Bilinmeyen hata(s): FATAL (FATAL) alanındaki bellek temizleme: cpu=0 Err=0008:00c2 (ch=2), addr = 0x1b63f7000 => socket=0, Kanal=3 (maske=8), rank=0Sep
22 17:58:47 hostname kernel:
Sep 22 17:58:47 hostname kernel: EDAC MC0: CE satır 0, kanal 0, etiket "CPU_SrcID#0_Channel#1_DIMM#0": 1 Bilinmeyen hata(s): FATAL (FATAL) alanındaki bellek temizleme: cpu=0 Err=0008:00c2 (ch=2), addr = 0x1b63f8000 => socket=0, Channel=1(mask=2), rank=0Sep 22 17:58:47 hostname kernel:Sep 22 18:00:08 hostname kernel: sbridge: (Kanal=1(maske=2), rank=0Sep 22 17:58:47 hostname kernel:Sep 22 18:00:08 hostname kernel: sbridge: (Kanal=1(maske=2), rank=0Sep
22 17:58:47 hostname kernel:
Sep 22 18:00:08 hostname kernel: sbridge: MCE BELLEK ERRORSep
22 18:00:08 ana bilgisayar adı çekirdeğini işleme: CPU 0: Makine Denetimi İstisnası: 0 Bank 10: 8c00004d000800c2Sep 22
18:00:08 ana bilgisayar adı çekirdeği: TSC 0 ADDR 2763f4000 MISC 90000080081a8c PROCESSOR 0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 hostname kernel: sbridge: MCE BELLEK ERRORSep
22 18:00:08 ana bilgisayar adı çekirdeğini işleme: CPU 0: Makine Denetimi İstisnası: 0 Bank 10: 8c00004d000800c2Sep 22
18:00:08 ana bilgisayar adı çekirdeği: TSC 0 ADDR 2763f4000 MISC 900002000201a8c PROCESSOR 0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 hostname kernel: sbridge: MCE BELLEK ERRORSep
22 18:00:08 ana bilgisayar adı çekirdeğini işleme: CPU 0: Makine Denetimi İstisnası: 0 Bank 10: 8c00004d000800c2Sep 22
18:00:08 ana bilgisayar adı çekirdeği: TSC 0 ADDR 2763f4000 MISC 90000040041a8c PROCESSOR 0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 hostname kernel: sbridge: MCE BELLEK ERRORSep
22 18:00:08 ana bilgisayar adı çekirdeğini işleme: CPU 0: Makine Denetimi İstisnası: 0 Bank 10: 8c00004d000800c2Sep 22
18:00:08 ana bilgisayar adı çekirdeği: TSC 0 ADDR 2763f4000 MISC 90000040041a8c PROCESSOR 0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 hostname kernel: sbridge: MCE BELLEK ERRORSep
22 18:00:08 ana bilgisayar adı çekirdeğini işleme: CPU 0: Makine Denetimi İstisnası: 0 Bank 10: 8c00004d000800c2Sep 22
18:00:08 ana bilgisayar adı çekirdeği: TSC 0 ADDR 2763f5000 MISC 90000100101a8c İŞLEMCI 0:206d7 ZAMAN 1379887208 SOKET 0 APIC 0

 

原因

Tartışma:
 
Bu hatalar, Hata Bulma ve Düzeltme (EDAC) modülü, kayıtları yonga setinden okuduğunda ortaya çıkar. Kayıtlar bir kez okunur ve etkinleştirildiğinde bu kayıtları öncelikle EDAC alır; dolayısıyla, ESM/BMC/IPMI/iDRAC günlüğünde bellek veya CPU hataları görebilirsiniz.

 

解决方案

Çözüm:

 

  • Edac sürücüsünü engellenenler listesine ekleyin:
    • Edac modüllerini listeleyin:
      • # lsmod | grep -i edac
    • Çıktıyı alın ve bunları engellenenler listesine ekleyin:
    • "/etc/modprobe.d/blacklist.conf" dosyasını istediğiniz bir düzenleyici ile düzenleyin
    • Dosyanın alt kısmına modülleri ekleyin
    • Örnek:
      • blacklist i7core_edac
      • blacklist edac_core
  • Reboot
  • Donanım tanılaması çalıştırma

 

受影响的产品

Servers, PowerEdge, Software RAID with Red Hat Enterprise Linux4, Red Hat Enterprise Linux Version 5, Red Hat Enterprise Linux Version 6, Red Hat Enterprise Linux Version 7, Red Hat Enterprise Virtualization 3
文章属性
文章编号: 000177028
文章类型: Solution
上次修改时间: 04 2月 2025
版本:  8
从其他戴尔用户那里查找问题的答案
支持服务
检查您的设备是否在支持服务涵盖的范围内。