Errores de EDAC en el registro de "mensajes" en Red Hat Enterprise Linux (RHEL) y PowerEdge

概要: En este artículo, se proporciona información sobre los problemas relacionados con los errores de EDAC en el registro "mensajes" de Red Hat Enterprise Linux (RHEL).

この記事は次に適用されます: この記事は次には適用されません: この記事は、特定の製品に関連付けられていません。 すべての製品パージョンがこの記事に記載されているわけではありません。

現象

Problema: 

Es posible que en el registro "/var/log/messages" aparezca algo similar al siguiente ejemplo:
 

Sep 22 17:58:47 hostname kernel: EDAC MC0: Fila ce 0, canal 0, etiqueta "CPU_SrcID#0_Channel#1_DIMM#0": 1 Errores desconocidos: limpieza de memoria en el área FATAL: cpu=0 Err=0008:00c2 (ch=2), addr = 0x1b63f5000 => socket=0, Channel=1(mask=2), rank=0Sep
22 17:58:47 hostname kernel:
Sep 22 17:58:47 hostname kernel: EDAC MC0: Fila ce 1, canal 0, etiqueta "CPU_SrcID#0_Channel#2_DIMM#0": 1 Errores desconocidos: limpieza de memoria en el área FATAL: cpu=0 Err=0008:00c2 (ch=2), addr = 0x1b63f6000 => socket=0, Channel=2(mask=4), rank=0Sep
22 17:58:47 hostname kernel:
Sep 22 17:58:47 hostname kernel: EDAC MC0: Fila ce 1, canal 0, etiqueta "CPU_SrcID#0_Channel#2_DIMM#0": 1 Errores desconocidos: limpieza de memoria en el área FATAL: cpu=0 Err=0008:00c2 (ch=2), addr = 0x1b63f6000 => socket=0, Channel=2(mask=4), rank=0Sep
22 17:58:47 hostname kernel:
Sep 22 17:58:47 hostname kernel: EDAC MC0: Fila ce 2, canal 0, etiqueta "CPU_SrcID#0_Channel#3_DIMM#0": 1 Error(s) desconocido(s): limpieza de memoria en el área FATAL: cpu=0 Err=0008:00c2 (ch=2), addr = 0x1b63f7000 => socket=0, Channel=3(mask=8), rank=0Sep
22 17:58:47 hostname kernel:
Sep 22 17:58:47 hostname kernel: EDAC MC0: Fila ce 0, canal 0, etiqueta "CPU_SrcID#0_Channel#1_DIMM#0": 1 Errores desconocidos: limpieza de memoria en el área FATAL: cpu=0 Err=0008:00c2 (ch=2), addr = 0x1b63f8000 => socket=0, Channel=1 (mask=2), rank=0Sep
22 17:58:47 hostname kernel:
Sep 22 18:00:08 hostname kernel: sbridge: MANEJO DE ERRORES DE
MEMORIA DE MCESep 22 18:00:08 hostname kernel: CPU 0: Excepción de comprobación de máquina: 0 Banco 10: 8c00004d000800c2Sep
22 kernel de nombre de host 18:00:08: TSC 0 ADDR 2763f4000 MISC 900000800081a8c PROCESADOR 0:206d7 TIEMPO 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 hostname kernel: sbridge: MANEJO DE ERRORES DE
MEMORIA DE MCESep 22 18:00:08 hostname kernel: CPU 0: Excepción de comprobación de máquina: 0 Banco 10: 8c00004d000800c2Sep
22 kernel de nombre de host 18:00:08: TSC 0 ADDR 2763f4000 MISC 900002000201a8c PROCESADOR 0:206d7 TIEMPO 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 hostname kernel: sbridge: MANEJO DE ERRORES DE
MEMORIA DE MCESep 22 18:00:08 hostname kernel: CPU 0: Excepción de comprobación de máquina: 0 Banco 10: 8c00004d000800c2Sep
22 kernel de nombre de host 18:00:08: TSC 0 ADDR 2763f4000 MISC 900000400041a8c PROCESADOR 0:206d7 TIEMPO 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 hostname kernel: sbridge: MANEJO DE ERRORES DE
MEMORIA DE MCESep 22 18:00:08 hostname kernel: CPU 0: Excepción de comprobación de máquina: 0 Banco 10: 8c00004d000800c2Sep
22 kernel de nombre de host 18:00:08: TSC 0 ADDR 2763f4000 MISC 900000400041a8c PROCESADOR 0:206d7 TIEMPO 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 hostname kernel: sbridge: MANEJO DE ERRORES DE
MEMORIA DE MCESep 22 18:00:08 hostname kernel: CPU 0: Excepción de comprobación de máquina: 0 Banco 10: 8c00004d000800c2Sep
22 kernel de nombre de host 18:00:08: TSC 0 ADDR 2763f5000 MISC 900001000101a8c PROCESADOR 0:206d7 TIEMPO 1379887208 SOCKET 0 APIC 0

 

原因

Discusión:
 
Estos errores se producen cuando el módulo Detección y corrección de errores (EDAC) lee los registros del chipset. Es posible que no observe errores de memoria o CPU en el registro ESM/BMC/IPMI/iDRAC debido a que los registros se pueden leer una sola vez y cuando estén habilitados, EDAC los obtendrá primero.

 

解決方法

Resolución:

 

  • Incluya el controlador de EDAC en la lista negra:
    • Indique los módulos EDAC:
      • # lsmod | grep -i edac
    • Revise los resultados e inclúyalos en la lista negra:
    • Edite "/etc/modprobe.d/blacklist.conf" con el editor de su preferencia
    • Agregue los módulos a la parte inferior del archivo
    • Ejemplo:
      • Incluir en la lista negra i7core_edac
      • Incluir en la lista negra edac_core
  • Reiniciar por medio de un programa
  • Ejecute el diagnóstico de hardware

 

対象製品

Servers, PowerEdge, Software RAID with Red Hat Enterprise Linux4, Red Hat Enterprise Linux Version 5, Red Hat Enterprise Linux Version 6, Red Hat Enterprise Linux Version 7, Red Hat Enterprise Virtualization 3
文書のプロパティ
文書番号: 000177028
文書の種類: Solution
最終更新: 04 2月 2025
バージョン:  8
質問に対する他のDellユーザーからの回答を見つける
サポート サービス
お使いのデバイスがサポート サービスの対象かどうかを確認してください。