Data Domain: Solução de problemas de erros de memória

Summary: Este artigo da KB descreve como solucionar problemas de alertas de memória, incluindo como identificar um DIMM com defeito que precisa ser substituído.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Este artigo da KB descreve como solucionar problemas de alertas de memória, incluindo como identificar um DIMM com defeito que precisa ser substituído.

Possíveis sintomas/alertas:
 

DIMM-00001: Correctable ECC logging limit reached
DIMM-00002: Multibit Uncorrectable ECC error
DIMM-00003: A memory card has failed
ENVIRONMENT-00009: Memory correctable ECC errors exceed warning threshold
ENVIRONMENT-00013: Memory uncorrectable ECC error alert. 
ENVIRONMENT-00044: Memory riser fault has been detected
MEM-00001: DIMM failure detected after install. DDFS ""will not be started.
MEM-00002: Memory size(nnnnnnnnKB) goes below the configured size(nnnnnnnnKB)

*These may also be reported without the hyphen (-): e.g.
DIMM00001, DIMM00002, DIMM00003, ENVIRONMENT00009, ENVIRONMENT00013, ENVIRONMENT00044, MEM00001, MEM00002
  • Reinicialização do IPMI Watchdog
  • Alerta de memória menor do que o esperado
  • Possível travamento no autoteste de inicialização (POST)
  • O sistema não inicializa ou trava o sistema

Cause

Os DIMMs instalados nos sistemas Datadomain têm ECC (Error Checking Code, Código de Verificação de Erros), o que permite que os Erros de Memória Corrigíveis sejam corrigidos em tempo real. Se um limite de erro for atingido, o DDOS indicará a falha, e o DIMM afetado deverá ser substituído.
Erros de memória incorrigíveis podem causar uma reinicialização do sistema e são considerados uma falha de memória dura.
A falha total de qualquer DIMM ou riser de memória (abriga vários DIMMs) pode resultar em um evento de paralisação do sistema e impedir que o file system seja ativado. Isso ocorre porque o processo do DD Filesystem (DDFS) preenche a maior parte da memória física.

NOTA: Erros de memória podem ser mascarados por outros sintomas ou alertas, por exemplo, erro de verificação da máquina da CPU - pode ser necessária uma análise mais profunda do log e solução de problemas.

Resolution

O relatório de erros de DIMM é rastreado em todas as versões do DDOS. No entanto, a análise dos logs do sistema pode ser necessária para identificar o DIMM específico com falha.
Observação: Um DIMM pode residir dentro de uma riser de memória conectada à placa-mãe.
         Para que o Data Domain Filesystem (DDFS) seja ativado, TODA a memória instalada deve estar presente & funcional.

A solução de problemas pode incluir:

  • Diagnóstico off-line  
  • Análise do arquivo de log
  • Recolocar DIMMs suspeitos
  • Mover DIMMs suspeitos para slots "em boas condições" (ou seja, a falha segue o DIMM, slot, canal ou controlador?)
  • Substituição de DIMM ou riser com falha (conforme apropriado)  
  • Monitoramento contínuo para confirmar a estabilidade do sistema após alterações ou substituição do hardware

Nota: Se o problema persistir depois de executar as etapas deste artigo da KB, entre em contato com o provedor de suporte ou crie um chamado .

Additional Information

Referências:
- Consulte os guias relevantes de hardware do sistema DD para configuração/layout
do DIMM - Data Domain: Requisitos de memória do sistema e configurações de
armazenamento expandido- Data Domain: Cartão de memória | DIMM falhou, erro ou falha
- Data Domain: Placa de memória ou DIMM com erro de falha ou defeito
 

Affected Products

Data Domain, PowerProtect Data Protection Appliance, Data Domain, Data Domain Deduplication Storage Systems, PowerProtect Data Protection Hardware
Article Properties
Article Number: 000034334
Article Type: Solution
Last Modified: 05 Aug 2025
Version:  7
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.