RedHat Enterprise Linuxin (RHEL) ja PowerEdgen sanomalokin sisältämät EDAC-virheet

摘要: Tässä artikkelissa käsitellään RedHat Enterprise Linuxin (RHEL) sanomalokin sisältämiä EDAC-virheitä.

本文章適用於 本文章不適用於 本文無關於任何特定產品。 本文未識別所有產品版本。

症狀

Ongelma: 

/var/log/messages-lokissa on tämänkaltaisia sanomia:
 

Sep 22 17:58:47 hostname kernel: EDAC MC0: CE-rivi 0, kanava 0, merkintä "CPU_SrcID#0_Channel#1_DIMM#0": 1 Tuntematon virhe(t): muistin tyhjennys FATAL-alueella: cpu=0 Err=0008:00c2 (ch=2), lisälaite = 0x1b63f5000 => socket=0, Channel=1(mask=2), Rank=0Sep
22 17:58:47 hostname kernel:
Sep 22 17:58:47 hostname kernel: EDAC MC0: CE-rivi 1, kanava 0, merkintä "CPU_SrcID#0_Channel#2_DIMM#0": 1 Tuntematon virhe(t): muistin tyhjennys FATAL-alueella: cpu=0 Err=0008:00c2 (ch=2), lisälaite = 0x1b63f6000 => socket=0, Channel=2(mask=4), Rank=0Sep
22 17:58:47 hostname kernel:
Sep 22 17:58:47 hostname kernel: EDAC MC0: CE-rivi 1, kanava 0, merkintä "CPU_SrcID#0_Channel#2_DIMM#0": 1 Tuntematon virhe(t): muistin tyhjennys FATAL-alueella: cpu=0 Err=0008:00c2 (ch=2), lisälaite = 0x1b63f6000 => socket=0, Channel=2(mask=4), Rank=0Sep
22 17:58:47 hostname kernel:
Sep 22 17:58:47 hostname kernel: EDAC MC0: CE-rivi 2, kanava 0, merkintä "CPU_SrcID#0_Channel#3_DIMM#0": 1 Tuntematon virhe(t): muistin tyhjennys FATAL-alueella: cpu=0 Err=0008:00c2 (ch=2), lisälaite = 0x1b63f7000 => socket=0, Channel=3(mask=8), Rank=0Sep
22 17:58:47 hostname kernel:
Sep 22 17:58:47 hostname kernel: EDAC MC0: CE-rivi 0, kanava 0, merkintä "CPU_SrcID#0_Channel#1_DIMM#0": 1 Tuntematon virhe(t): muistin tyhjennys FATAL-alueella: cpu=0 Err=0008:00c2 (ch=2), lisälaite = 0x1b63f8000 => socket=0, Channel=1(mask=2), Rank=0Sep
22 17:58:47 hostname kernel:
Sep 22 18:00:08 hostname kernel: sbridge: HANDLING MCE MEMORY ERRORSep
22 18:00:08 hostname kernel: Suoritin 0: Koneen tarkistuksen poikkeus: 0 Pankki 10: 8c00004d000800c2Sep
22 18:00:08 hostname kernel: TSC 0 ADDR 2763f4000 MISC 90000080081a8c -SUORITin 0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 isäntänimi ydin: sbridge: HANDLING MCE MEMORY ERRORSep
22 18:00:08 hostname kernel: Suoritin 0: Koneen tarkistuksen poikkeus: 0 Pankki 10: 8c00004d000800c2Sep
22 18:00:08 hostname kernel: TSC 0 ADDR 2763f4000 MISC 900002000201a8c -SUORItin 0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 isäntänimi ydin: sbridge: HANDLING MCE MEMORY ERRORSep
22 18:00:08 hostname kernel: Suoritin 0: Koneen tarkistuksen poikkeus: 0 Pankki 10: 8c00004d000800c2Sep
22 18:00:08 hostname kernel: TSC 0 ADDR 2763f4000 MISC 9000040041a8c -SUORItin 0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 isäntänimi ydin: sbridge: HANDLING MCE MEMORY ERRORSep
22 18:00:08 hostname kernel: Suoritin 0: Koneen tarkistuksen poikkeus: 0 Pankki 10: 8c00004d000800c2Sep
22 18:00:08 hostname kernel: TSC 0 ADDR 2763f4000 MISC 9000040041a8c -SUORItin 0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 isäntänimi ydin: sbridge: HANDLING MCE MEMORY ERRORSep
22 18:00:08 hostname kernel: Suoritin 0: Koneen tarkistuksen poikkeus: 0 Pankki 10: 8c00004d000800c2Sep
22 18:00:08 hostname kernel: TSC 0 ADDR 2763f5000 MISC 90000100101a8c -SUORITIN 0:206d7 TIME 1379887208 SOCKET 0 APIC 0

 

原因

Käsittely:
 
Näitä virheitä ilmenee, kun virheiden tunnistus- ja korjausmoduuli (EDAC, Error Detection and Correction) lukee piirisarjan rekistereitä. ESM/BMC/IPMI/iDRAC-lokissa ei välttämättä näy muistin tai suorittimen virheitä, koska rekisterit luetaan yhden kerran ja EDAC huomaa ne ensin, kun se on otettu käyttöön.

 

解析度

Ratkaisu:

 

  • Lisää EDAC-ohjain kiellettyjen luetteloon:
    • Laadi EDAC-moduulien luettelo:
      • # lsmod | grep -i edac
    • Lisää tulokset kiellettyjen luetteloon:
    • Muokkaa /etc/modprobe.d/blacklist.conf-tiedoston sisältöä haluamallasi muokkausohjelmalla.
    • Lisää moduulit tiedoston loppuun.
    • Esimerkki:
      • Lisää i7core_edac kiellettyjen luetteloon.
      • Lisää edac_core kiellettyjen luetteloon.
  • Uudelleenkäynnistys
  • Suorita laitteiston diagnostiikka

 

受影響的產品

Servers, PowerEdge, Software RAID with Red Hat Enterprise Linux4, Red Hat Enterprise Linux Version 5, Red Hat Enterprise Linux Version 6, Red Hat Enterprise Linux Version 7, Red Hat Enterprise Virtualization 3
文章屬性
文章編號: 000177028
文章類型: Solution
上次修改時間: 04 2月 2025
版本:  8
向其他 Dell 使用者尋求您問題的答案
支援服務
檢查您的裝置是否在支援服務的涵蓋範圍內。