Skip to main content
  • Place orders quickly and easily
  • View orders and track your shipping status
  • Enjoy members-only rewards and discounts
  • Create and access a list of your products
  • Manage your Dell EMC sites, products, and product-level contacts using Company Administration.

Como solucionar problemas de erros de memória ou de bateria no controlador PERC nos servidores Dell PowerEdge

Summary: Aqui você encontra informações detalhadas sobre como solucionar problemas de memória e de bateria nos controladores RAID PowerEdge (PERC), que são utilizados em servidores Dell.

This article may have been automatically translated. If you have any feedback regarding its quality, please let us know using the form at the bottom of this page.

Article Content


Symptoms

Resumo do artigo: este artigo fornece informações sobre como solucionar o erro "Memory/battery problems were detected. O adaptador foi recuperado, mas dados de cache foram perdidos. Press any key to continue" (Foram detectados problemas na memória/bateria. O controlador foi recuperado, mas os dados de cache foram perdidos. Pressione qualquer tecla para continuar.) e outros erros relacionados à memória que podem ocorrer no controlador Dell PERC em servidores Dell PowerEdge.
 

Sumário:

  1. Mensagem de erro do controlador RAID durante o POST
  2. Condições de solução de problemas que resultam em mensagem de erro
    1. Reinicialização do SO
    2. Limpar cache do controlador
    3. Verificar o controlador PERC físico
  3. Informações adicionais
    1. Manutenção da bateria PERC
    2. Uso de cache 
       

1. Mensagem de erro do controlador RAID durante o POST

Durante o POST, o controlador RAID apresenta uma mensagem:

Memory/battery problems were detected. The adapter has recovered but cache data may be lost. Pressione qualquer tecla para continuar.

Para erros que aparecem na tela LCD ou durante a execução do diagnóstico, consulte o seguinte artigo:

Interpreting LCD and Embedded Diagnostic (ePSA) event messages.(Interpretando mensagens de eventos de LCD e diagnóstico incorporado (ePSA)). 

Voltar ao início
 


2. Condições de solução de problemas que resultam em mensagem de erro

Essa mensagem normalmente ocorre mediante uma das condições a seguir. Os eventos associados à solução de problemas provavelmente também impedirão que essa mensagem ocorra.

  • O SO indica encerramento anormal.
  • O SO indica a ocorrência de um erro (tela azul no Windows).
  • Há de perda espontânea de energia.

Etapas comuns de solução de problemas incluem:
 

1. Reinicialização do SO

Se o boot do SO for bem-sucedido, o sistema não exibirá nenhuma mensagem após a reinicialização.

2. Limpar cache do controlador

  1. CTRL+M para controladores SCSI (PERC 3 e PERC 4).
  2. CTRL+R para controladores SAS/SATA (controladores PERC 5, PERC 6 e mais recentes).
  3. Aguarde a limpeza do conteúdo de cache, que leva cinco minutos.
  4. Reinicialize o BIOS do controlador.
    Nota: Se o erro persistir, há mais chances de haver um erro no hardware. Entre em contato com o Suporte técnico para obter mais informações para a solução de problemas.
  5. Se o erro for resolvido, execute o boot do SO.
  6. Se o boot do SO ainda não for bem-sucedido e/ou o erro persistir, isso pode indicar um problema com o SO. Se seu contrato de garantia estiver ativo, entre em contato com o Suporte técnico para obter mais informações sobre a solução de problemas.

Voltar ao início
 

3. Verificar o controlador PERC físico

 

  1. Verifique se o DIMM e o soquete do DIMM estão danificados.
    1. Desligue o sistema e remova os cabos de alimentação.
    2. Deixe o sistema em repouso por 30 segundos para permitir que toda a energia restante seja dissipada.
    3. Remova o controlador PERC. Para obter informações sobre a remoção e substituição de peças nesse sistema, consulte o guia do usuário disponível no Suporte Dell.
    4. Remova a bateria da memória RAID. Lembre-se de reinstalar a bateria da memória depois de inserir o DIMM.
    5. Remova o DIMM da memória do controlador (se aplicável).
    6. Verifique se há pinos tortos ou outros danos no soquete do DIMM. Verifique se o conector de borda do DIMM da memória está danificado.
  2. Se o controlador tiver incorporado memória ou o soquete da memória estiver danificado, será necessário substituir o controlador PERC.
  3. Se a memória estiver danificada, será necessário substituir a memória do controlador.
  4. Se não houver danos, substitua o DIMM da memória e reinstale o controlador.
  5. Troque a memória do controlador por uma memória em boas condições (se possível).
    1. Se não houver uma memória em boas condições, entre em contato com o suporte.
    2. Se o erro não ocorrer com a memória que está em boas condições, substitua a memória.
    3. Se o erro persistir com a memória que está em boas condições, substitua o controlador PERC.
 

Voltar ao início



3. Informações adicionais


A mensagem de erro exibida durante o POST indica que o cache do controlador não contém todas as informações esperadas ou contém dados destinados a um disco rígido que não podem ou não foram gravados na unidade. Os motivos mais comuns pelos quais esse erro ocorre são:
 

  • O servidor não executou um processo de encerramento normal — perda de energia e reinicialização espontâneas podem fazer com que dados incompletos ou corrompidos permaneçam no cache e não possam ser gravados em uma unidade.
  • A memória cache está com defeito - uma memória cache inválida pode corromper os dados. Isso pode causar problemas relacionados ao SO e reinicializações espontâneas.
  • Perda de energia da bateria durante o encerramento do servidor — os controladores que não usam memória NVCACHE (Non-Volatile Cache, cache não volátil) utilizam baterias que podem reter o conteúdo do cache por um tempo limitado (de 24 a 72 horas) enquanto o servidor permanece desligado. Após a dissipação da energia da bateria, todo o conteúdo do cache é perdido e o controlador reconhece que a memória cache não contém todas as informações esperadas. É pouco provável encontrar esse problema em controladores que não utilizam NVCache (alguns controladores H700/H800 e controladores mais recentes, como H710, H710P, H810), pois a bateria precisa manter a alimentação apenas por 30 segundos ou menos, na maioria dos casos.


Voltar ao início

1. Manutenção da bateria PERC


É necessário executar um ciclo de aprendizagem manual em baterias PERC que supostamente falharam ou aparecem com um símbolo de aviso no OpenManage Server Administrator (OMSA).  Um Ciclo de aprendizagem faz com que a bateria descarregue e recarregue, e deve restaurar a bateria a uma condição totalmente funcional. Em alguns casos, vários procedimentos de Ciclo de aprendizagem podem ser necessários para restaurar a bateria a um estado carregado com eficácia. Para executar um ciclo de aprendizagem manual, selecione Start Learn Cycle no menu suspenso Battery Tasks no OMSA.

SLN130018_en_US__1I_PERC_Battery_JM_V1
Figura 1: Menu suspenso Battery Tasks no OMSA

Voltar ao início

2. Uso de cache

Controladores RAID de hardware utilizam cache (um repositório temporário de informações) para o seu funcionamento normal. O cache de operação normal é composto por memória DRAM, que, como memória do sistema, somente retém os dados enquanto estiver ligada.

Os controladores mais recentes utilizam NVCache, que é usado quando o servidor está desligado. A memória NVCache contém tanto memória DRAM (para operação normal) quanto memória flash (não volátil). A bateria dos controladores (se operacional) alimenta a memória DRAM durante as quedas de energia, permitindo copiar o conteúdo para armazenamento por tempo indeterminado na memória flash.
 

O conteúdo do cache pode ser essencialmente dividido em três partes:
  1. Configuração e metadados de RAID - informações sobre as arrays RAID, incluindo informações de configuração, membros do disco, função dos discos, etc.
  2. Registros do controlador — os controladores RAID mantêm vários arquivos de registro. Os técnicos da Dell utilizam o TTY Log (Registro TTY) como registro principal para a solução de diversos problemas com RAID e com o disco rígido.
  3. Dados RAID - esses são os dados reais destinados a serem gravados nos discos rígidos individuais. Os dados são gravados no cache do controlador em ambos os modos de política de cache Write-Through e Write-back.


Voltar ao início


Cause

-

Resolution

-

Article Properties


Affected Product

PowerEdge, OEMR R720xd

Last Published Date

25 Mar 2022

Version

6

Article Type

Solution