Data Domain: Solución de problemas de errores de memoria
Summary: En este artículo de la base de conocimientos, se describe cómo solucionar problemas de alertas de memoria, incluido cómo identificar un DIMM defectuoso que se debe reemplazar.
Symptoms
En este artículo de la base de conocimientos, se describe cómo solucionar problemas de alertas de memoria, incluido cómo identificar un DIMM defectuoso que se debe reemplazar.
Posibles síntomas o alertas:
DIMM-00001: Correctable ECC logging limit reached DIMM-00002: Multibit Uncorrectable ECC error DIMM-00003: A memory card has failed ENVIRONMENT-00009: Memory correctable ECC errors exceed warning threshold ENVIRONMENT-00013: Memory uncorrectable ECC error alert. ENVIRONMENT-00044: Memory riser fault has been detected MEM-00001: DIMM failure detected after install. DDFS ""will not be started. MEM-00002: Memory size(nnnnnnnnKB) goes below the configured size(nnnnnnnnKB)
*These may also be reported without the hyphen (-): e.g.
DIMM00001, DIMM00002, DIMM00003, ENVIRONMENT00009, ENVIRONMENT00013, ENVIRONMENT00044, MEM00001, MEM00002
- Reinicio de vigilancia IPMI
- Alerta de menor memoria que la esperada
- Posible bloqueo en la autoprueba de encendido (POST)
- El sistema no arranca o se bloquea
Cause
Los errores de memoria incorregibles podrían provocar un reinicio del sistema y se consideran una falla de la memoria dura.
Una falla total de cualquier DIMM o tarjeta elevadora de memoria (aloja varios DIMM) puede provocar un evento de apagado del sistema e impedir la habilitación del sistema de archivos. Esto se debe a que el proceso del sistema de archivos de DD (DDFS) llena la mayor parte de la memoria física.
NOTA: Los errores de memoria pueden enmascararse con otros síntomas o alertas; por ejemplo, un error de comprobación de máquina de CPU. Es posible que se requiera un análisis de registro más profundo y una solución de problemas.
Resolution
La generación de informes de errores de DIMM se rastrea en todas las versiones de DDOS. Sin embargo, es posible que se requiera un análisis de los registros del sistema para identificar el DIMM específico con falla.
Nota: Un DIMM puede residir dentro de una tarjeta vertical de memoria conectada a la placa base.
Para que el sistema de archivos de Data Domain (DDFS) esté habilitado, TODA la memoria instalada debe estar presente y funcional.
La solución de problemas puede incluir:
- Diagnóstico offline
- Análisis de archivos de registro
- Volver a insertar los DIMM sospechosos
- Mover módulos DIMM sospechosos a ranuras "en buen estado" (es decir, ¿la falla sigue al DIMM, la ranura, el canal o la controladora?)
- Consulte la "Guía de pruebas de intercambio de Dell" Data Domain: Tarjeta de memoria o DIMM con fallas o error de falla
- Reemplazo del DIMM o la tarjeta elevadora defectuosos (según corresponda)
- Monitoreo continuo para confirmar la estabilidad del sistema después de cambios o reemplazos de hardware
Nota: Si el problema persiste después de ejecutar los pasos de este artículo de la base de conocimientos, póngase en contacto con el proveedor de soporte o cree una solicitud de servicio .
Additional Information
Referencias:
- Consulte las guías de hardware del sistema DD pertinentes para la configuración/diseño
de DIMM en Data Domain: Requisitos de memoria del sistema y configuraciones
de almacenamiento expandido- Data Domain: Tarjeta de memoria | DIMM fallido, error o falla
: Data Domain: Tarjeta de memoria o DIMM con fallas o error de falla