Data Domain: Solução de problemas de erros de memória
Summary: Este artigo da KB descreve como solucionar problemas de alertas de memória, incluindo como identificar um DIMM com defeito que precisa ser substituído.
Symptoms
Este artigo da KB descreve como solucionar problemas de alertas de memória, incluindo como identificar um DIMM com defeito que precisa ser substituído.
Possíveis sintomas/alertas:
DIMM-00001: Correctable ECC logging limit reached DIMM-00002: Multibit Uncorrectable ECC error DIMM-00003: A memory card has failed ENVIRONMENT-00009: Memory correctable ECC errors exceed warning threshold ENVIRONMENT-00013: Memory uncorrectable ECC error alert. ENVIRONMENT-00044: Memory riser fault has been detected MEM-00001: DIMM failure detected after install. DDFS ""will not be started. MEM-00002: Memory size(nnnnnnnnKB) goes below the configured size(nnnnnnnnKB)
*These may also be reported without the hyphen (-): e.g.
DIMM00001, DIMM00002, DIMM00003, ENVIRONMENT00009, ENVIRONMENT00013, ENVIRONMENT00044, MEM00001, MEM00002
- Reinicialização do IPMI Watchdog
- Alerta de memória menor do que o esperado
- Possível travamento no autoteste de inicialização (POST)
- O sistema não inicializa ou trava o sistema
Cause
Erros de memória incorrigíveis podem causar uma reinicialização do sistema e são considerados uma falha de memória dura.
A falha total de qualquer DIMM ou riser de memória (abriga vários DIMMs) pode resultar em um evento de paralisação do sistema e impedir que o file system seja ativado. Isso ocorre porque o processo do DD Filesystem (DDFS) preenche a maior parte da memória física.
NOTA: Erros de memória podem ser mascarados por outros sintomas ou alertas, por exemplo, erro de verificação da máquina da CPU - pode ser necessária uma análise mais profunda do log e solução de problemas.
Resolution
O relatório de erros de DIMM é rastreado em todas as versões do DDOS. No entanto, a análise dos logs do sistema pode ser necessária para identificar o DIMM específico com falha.
Observação: Um DIMM pode residir dentro de uma riser de memória conectada à placa-mãe.
Para que o Data Domain Filesystem (DDFS) seja ativado, TODA a memória instalada deve estar presente & funcional.
A solução de problemas pode incluir:
- Diagnóstico off-line
- Análise do arquivo de log
- Recolocar DIMMs suspeitos
- Mover DIMMs suspeitos para slots "em boas condições" (ou seja, a falha segue o DIMM, slot, canal ou controlador?)
- Consulte o "Guia de testes de troca da Dell" Data Domain: Placa de memória ou DIMM com erro de falha ou defeito
- Substituição de DIMM ou riser com falha (conforme apropriado)
- Monitoramento contínuo para confirmar a estabilidade do sistema após alterações ou substituição do hardware
Nota: Se o problema persistir depois de executar as etapas deste artigo da KB, entre em contato com o provedor de suporte ou crie um chamado .
Additional Information
Referências:
- Consulte os guias relevantes de hardware do sistema DD para configuração/layout
do DIMM - Data Domain: Requisitos de memória do sistema e configurações de
armazenamento expandido- Data Domain: Cartão de memória | DIMM falhou, erro ou falha
- Data Domain: Placa de memória ou DIMM com erro de falha ou defeito