Base de conhecimento

Erros de memória de solução de problemas em sistemas PowerEdge, teste de troca


Quando um erro de bit único (SBE) e/ou erro de vários bits (MBE) é informada em um ou mais DIMM de memória locais, a causa pode não ser a DIMM em si, portanto, alguns simples solução de problemas será necessário para ser executado para determinar onde exatamente a falha. Consulte a Figura 1 (apenas em inglês) para um exemplo de erros de memória sendo exibido na interface iDRAC em um R715.


Figura 1: erros de memória como exibido no iDRAC 6 registros

Isolar problemas de memória envolve a troca DIMMs de memória em soquetes, os canais diferentes de memória, os bancos e controladores. Há várias maneiras de você pode trocar os DIMMs para restringir a falha. Pode ser necessário usar mais de um destes métodos para identificar o DIMM com falha ou no soquete. Abaixo, você encontrará uma representação desses métodos. Para fazer as explicações fáceis, vamos assumir o DIMM está com defeito A1 ou é um dos definir marcados em azul nas ilustrações.

Nota: Você pode ler mais sobre a memória para os seus sistemas em nossa memória artigos


Troca os DIMMs em grupos (por canal ou Banco) em vez de individualmente é o melhor método para identificar o DIMM ou DIMM com falha
Depois que um grupo de DIMMs foi identificado para conter o DIMM ou DIMM com falha e, em seguida, movendo DIMMs em fileira pode ser usado para identificar qual DIMM(s) falhou

Nota: o vídeo da memória Arquivocontém vídeos mostrando como remover e instalar a memória em diferentes servidores.


Método 1:

A troca DIMM A1 (marcados em azul) com DIMM A9 (Marcado de vermelho) para tentar o DIMM em um canal de memória diferente e o banco


Figura 2: Trocando DIMM A1 com DIMM A9
 

Método 2:

A troca DIMM A1(marcados em azul) com DIMM B1(marcado de vermelho) que o controlador de memória DIMM em um completamente diferente (CPU).


Figura 3: Trocando DIMM A1 com DIMM B1
 

Método 3:

A troca a todo banco de DIMMS (A1, A2, A3 - marcada azul) com outro banco (B1, B2, B3 - marcados em vermelho) vai testar a todo banco de DIMMs em um novo banco, em um novo controlador de memória.


Figura 4: Troca os DIMMs A1, A2, A3 com DIMMs B1, B2, B3
 

Método 4

A troca de um todo canal de DIMMs (A1, A4, A7 - marcada azul) com outro canal (B1, B2, B3 - marcados em vermelho) vai testar todo um novo canal de DIMMs no canal, e em um novo controlador de memória.


Figura 5: Troca os DIMMs A1, A4, A7 com DIMMs B1, B4, B7
 

Interpretando os resultados após troca os DIMMs

Como regra geral, erros de DIMM tendem a seguir os DIMMs identificada nos erros.  Por exemplo, com um SBE relatórios em DIMM A1, trocando o DIMM com um DIMM diferente resultará em um dos seguintes:

  1. A mensagem de erro não é mais informado e o problema está resolvido
  •   Isso indica que a memória recolocá-lo resolveu o problema
  1. A mensagem de erro acompanha o DIMM (DIMM A1 é trocado por DIMM B1, e as mensagens de erro é agora contra DIMM B1)
  • Isso indica que o DIMM é mais provável que falhou e precisa ser substituído.
  1. A mensagem de erro acompanha o soquete do DIMM (DIMM A1 é trocado por DIMM B1, e mensagens de erro ainda é reportado contra DIMM A1)
  • Isso indica que a placa de sistema ou da CPU é mais provável que falhou
  • CPUs troca irá confirmar qual componente requer a substituição
  • Se o problema ocorre no CPU (mensagem de erro move-se depois da troca CPUs), substitua CPU
  • Se o problema permanece no soquete do DIMM, substitua a placa de sistema
  1. A mensagem de erro não segue o DIMM ou o soquete (erro é relatado em um DIMM completamente diferente após a troca)
  • Isso indica que um módulo DIMM diferente ou DIMMs é mais provavelmente está com defeito
 
Gostaríamos que também para manter o seu dos níveis de firmware atualizado , pois isso pode reduzir o risco de receber erros de memória, bem como prolongar a vida útil do DIMMs


{PE_FOOTER.PT-BR}


ID do artigo: SLN289424

Data da última modificação: 22/06/2017 09:25


Classifique este artigo

Preciso
Úteis
Fácil de entender
Este artigo foi útil?
Sim Não
Envie seus comentários
Os comentários não podem conter estes caracteres especiais: <>()\
Infelizmente, o nosso sistema de feedback está atualmente desativado. Tente novamente mais tarde.

Agradecemos o feedback.