EDAC-feil i «messages»-loggen (meldinger) i Red Hat Enterprise Linux (RHEL) og PowerEdge

概要: Denne artikkelen inneholder informasjon om problemer med EDAC-feil i «messages»-loggen (meldinger) i Red Hat Enterprise Linux (RHEL).

この記事は次に適用されます: この記事は次には適用されません: この記事は、特定の製品に関連付けられていません。 すべての製品パージョンがこの記事に記載されているわけではありません。

現象

Problem: 

Du kan se noe som ligner på følgende i loggen «/var/log/messages»:
 

Sep 22 17:58:47 hostname kernel: EDAC MC0: CE-rad 0, kanal 0, etikett «CPU_SrcID#0_Channel#1_DIMM#0»: 1 Ukjent feil: minneskrubbing på FATAL-området: cpu=0 err=0008:00c2 (ch=2), addr = 0x1b63f5000 => socket=0, Kanal = 1 (maske = 2), nivå = 0Sep
22 17:58:47 vertsnavnkjerne:
22. september 17:58:47 vertsnavnkjerne: EDAC MC0: CE-rad 1, kanal 0, etikett «CPU_SrcID#0_Channel#2_DIMM#0»: 1 Ukjent feil: minneskrubbing på FATAL-området: cpu=0 err=0008:00c2 (ch=2), addr = 0x1b63f6000 => socket=0, Kanal= 2 (maske = 4), nivå = 0Sep
22 17:58:47 vertsnavnkjerne:
22. september 17:58:47 vertsnavnkjerne: EDAC MC0: CE-rad 1, kanal 0, etikett «CPU_SrcID#0_Channel#2_DIMM#0»: 1 Ukjent feil: minneskrubbing på FATAL-området: cpu=0 err=0008:00c2 (ch=2), addr = 0x1b63f6000 => socket=0, Kanal= 2 (maske = 4), nivå = 0Sep
22 17:58:47 vertsnavnkjerne:
22. september 17:58:47 vertsnavnkjerne: EDAC MC0: CE-rad 2, kanal 0, etikett «CPU_SrcID#0_Channel#3_DIMM#0»: 1 Ukjent feil: minneskrubbing på FATAL-området: cpu=0 err=0008:00c2 (ch=2), addr = 0x1b63f7000 => socket=0, Kanal= 3 (maske = 8), nivå = 0Sep
22 17:58:47 vertsnavnkjerne:
22. september 17:58:47 vertsnavnkjerne: EDAC MC0: CE-rad 0, kanal 0, etikett «CPU_SrcID#0_Channel#1_DIMM#0»: 1 Ukjent feil: minneskrubbing på FATAL-området: cpu=0 err=0008:00c2 (ch=2), addr = 0x1b63f8000 => socket=0, Channel=1(mask=2), rank=0Sep
22 17:58:47 hostname kernel:
Sep 22 18:00:08 vertsnavn kjerne: sbridge: HÅNDTERING AV MCE-MINNEFEIL
22 18:00:08 vertsnavnkjerne: CPU 0: Maskinkontrollunntak: 0 Bank 10: 8c00004d000800c2Sep
22 18:00:08 vertsnavnkjerne: TSC 0 ADDR 2763f4000 MISC 90000800081a8c-PROSESSOR 0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 vertsnavnkjerne: sbridge: HÅNDTERING AV MCE-MINNEFEIL
22 18:00:08 vertsnavnkjerne: CPU 0: Maskinkontrollunntak: 0 Bank 10: 8c00004d000800c2Sep
22 18:00:08 vertsnavnkjerne: TSC 0 ADDR 2763f4000 MISC 900002000201a8c-PROSESSOR 0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 vertsnavnkjerne: sbridge: HÅNDTERING AV MCE-MINNEFEIL
22 18:00:08 vertsnavnkjerne: CPU 0: Maskinkontrollunntak: 0 Bank 10: 8c00004d000800c2Sep
22 18:00:08 vertsnavnkjerne: TSC 0 ADDR 2763f4000 MISC 90000040041a8c-PROSESSOR 0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 vertsnavnkjerne: sbridge: HÅNDTERING AV MCE-MINNEFEIL
22 18:00:08 vertsnavnkjerne: CPU 0: Maskinkontrollunntak: 0 Bank 10: 8c00004d000800c2Sep
22 18:00:08 vertsnavnkjerne: TSC 0 ADDR 2763f4000 MISC 90000040041a8c-PROSESSOR 0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 vertsnavnkjerne: sbridge: HÅNDTERING AV MCE-MINNEFEIL
22 18:00:08 vertsnavnkjerne: CPU 0: Maskinkontrollunntak: 0 Bank 10: 8c00004d000800c2Sep
22 18:00:08 vertsnavnkjerne: TSC 0 ADDR 2763f5000 MISC 90000100101a8C-PROSESSOR 0:206d7- 1379887208 SOCKET 0 APIC 0

 

原因

Diskusjon:
 
Disse feilene oppstår når modulen for feilsøking og feilretting (EDAC) leser registrene fra brikkesettet. Det er mulig at du ikke oppdager minne- eller CPU-feil i loggen ESM/BMC/IPMI/iDRAC ettersom registrene bare leses én gang, og når de er aktivert, vil EDAC få dem først.

 

解決方法

Løsning:

 

  • Svarteliste edac-driveren:
    • Oppgi edac-moduler:
      • # lsmod | grep -i edac
    • Ta utdataene og svartelist dem:
    • Rediger «/etc/modprobe.d/blacklist.conf» med redigeringsprogrammet du liker best
    • Legg til modulene nederst i filen
    • Eksempel:
      • blacklist i7core_edac
      • blacklist edac_core
  • Reboot
  • Kjøre diagnostikk av maskinvaren

 

対象製品

Servers, PowerEdge, Software RAID with Red Hat Enterprise Linux4, Red Hat Enterprise Linux Version 5, Red Hat Enterprise Linux Version 6, Red Hat Enterprise Linux Version 7, Red Hat Enterprise Virtualization 3
文書のプロパティ
文書番号: 000177028
文書の種類: Solution
最終更新: 04 2月 2025
バージョン:  8
質問に対する他のDellユーザーからの回答を見つける
サポート サービス
お使いのデバイスがサポート サービスの対象かどうかを確認してください。