PowerEdge: Diretrizes de solução de problemas de memória
Summary:Este artigo apresenta as etapas recomendadas para ajudar a solucionar problemas de eventos relacionados à memória em servidores Dell PowerEdge.
Please select a product to check article relevancy
This article applies to This article does not apply toThis article is not tied to any specific product.Not all product versions are identified in this article.
Seu servidor pode relatar eventos de memória como (mas não limitado a):
MEM0802
MEM6102
MEM6101
MEM5100
MEM5104
UEFI0103 - Erro de inicialização da memória no slot:
MEM6101 - Aviso de diagnóstico no dispositivo de memória em Verificar a configuração do dispositivo e do sistema. (ID estendido: )
MEM0001 - Evento incorrigível consumido; pode causar a reinicialização do servidor se o sistema operacional não puder se recuperar.
MEM9072 - Limpeza de patrulha encontrou erro incorrigível (não consumido); nenhum impacto, a menos que o sistema operacional use a memória.
MEM6104 - Erro incorrigível; Os bytes estendidos mostram se o endereço foi consumido ou identificado pela depuração de patrulha.
Etapas iniciais de solução de problemas
A maioria dos problemas acima são resolvidos ou diagnosticados com precisão atualizando o firmware de componentes específicos. As atualizações de firmware contêm correções para problemas e aprimoramentos conhecidos, tornando-as um primeiro passo essencial para a resolução.
Atualize o firmware dos seguintes componentes:
CPLD
iDRAC
BIOS
Nota: Se o firmware do CPLD não estiver disponível para o modelo de servidor, isso não é um problema, prossiga com o restante das atualizações
Depois que as etapas iniciais forem concluídas, o problema poderá ser resolvido ou mais soluções de problemas poderão ser necessárias, dependendo das informações nos logs do TSR, para identificar o componente com defeito.
Ao analisar os logs do TSR, as seguintes mensagens de erro podem ser identificadas:
Eventos de memória de bit único (memória degradada) encontrados nos logs:
Desligue o sistema, desconecte a energia, pressione e mantenha pressionado o botão liga/desliga por 10 segundos para remover toda a energia restante
Equipamento de proteção contra descarga eletrostática (ESD)
Remova o DIMM relatado
Troque o DIMM em outro slot com um DIMM em boas condições
Feche-o e conecte-o à alimentação novamente
Ativá-lo
Reinicie-o duas vezes (reinicialização > do POST > do SO > POST > reinicialização do SO>)
Colete um novo TSR e verifique novamente se há eventos de memória
Eventos de memória de vários bits (memória com falha) encontrados nos registros:
Desligue o sistema, desconecte a energia, pressione e mantenha pressionado o botão liga/desliga por 10 segundos para remover toda a energia restante
Equipamento de proteção contra descarga eletrostática (ESD)
Remova o DIMM relatado
Verifique se a máquina está em uma configuração de memória compatível, caso contrário, remova os DIMMs adicionais até que ela seja atingida
Feche-o e conecte-o à alimentação novamente
Ativá-lo
Colete um novo TSR e verifique novamente se há eventos de memória
Dependendo do resultado das etapas avançadas de solução de problemas, será necessária a substituição de uma peça para o DIMM de memória, se o evento de memória mudar de slot, ou para a placa-mãe, se o evento de memória permanecer no mesmo slot.