PowerFlex: Procedimento para atualizar o firmware a fim de reduzir um problema de perda de carga das baterias do NVDIMM nos nós PowerFlex Custom Nodes (R650, R750)
Summary: Procedimento para atualizar o firmware a fim de reduzir um problema de perda de carga das baterias do NVDIMM nos nós PowerFlex Custom Nodes (R650, R750).
Instructions
Descrição do problema
Os sistemas Dell PowerFlex 15G oferecem suporte a uma configuração que contém NVDIMMs, que oferecem a memória persistente necessária para o recurso Fine Granularity. Este procedimento contém as etapas para atualizar as versões do iDRAC e do CPLD para as seguintes:
- iDRAC 7.10.50.201
- CPLD 1.1.1
Local de download
- PowerFlex Custom Node: https://www.dell.com/support/home/pt-br/product-support/product/powerflex-custom-node/drivers
- (pesquise por iDRAC e CPLD)
A nova versão do iDRAC verifica as tensões da célula da bateria do NVDIMM quando ele está ativado. Ele registrará um erro se as tensões da célula estiverem abaixo de um limite definido. Ele também registra um log com informações de gravidade quando a bateria do NVDIMM transita entre os estados READY e ENABLED.
O novo design do CPLD rastreia o estado "Enabled" da bateria do NVDIMM e faz a transição de volta para o estado "Ready" após um período fixo.
- NOTA: Como resultado do problema acima, existe a possibilidade de a bateria do NVDIMM nos nós estar danificada e precisar ser substituída. Este procedimento engloba essa possibilidade.
- NOTA: Esta atualização do iDRAC e do CPLD deve seguir uma sequência específica. A sequência exige, primeiro, o upgrade do iDRAC e, depois, do CPLD. Isso ajuda a identificar se a bateria falhou.
Visão geral do procedimento
Para resolver totalmente o problema, é necessário seguir estas etapas:
- Identifique quais baterias do NVDIMM no sistema não têm carga suficiente.
- Como essa condição específica não é relatada, nós devemos atualizar o iDRAC para a versão indicada acima (ou posterior). Essa nova versão do iDRAC relatará erros BAT0021 ou BAT0017 se detectar uma bateria do NVDIMM descarregada.
- Atualize o iDRAC para a versão indicada em todos os nós do sistema
- Solicite baterias de reposição do NVDIMM para cada uma que for relatada como descarregada e com defeito.
- Somente prossiga com a atualização do CPLD em nós com baterias defeituosas do NVDIMM depois de substituir as referidas baterias.
- As baterias de reposição podem não vir totalmente carregadas e podem exigir até 75 minutos para atingir a carga total após a instalação.
- Para nós com boas baterias do NVDIMM, você pode prosseguir com a atualização do FW do CPLD.
- Depois de substituir as baterias defeituosas, prossiga para a atualização do firmware do CPLD usando o iDRAC.
- Antes de concluir a atualização, é necessário colocar o nó no modo de manutenção
- Reinicialize o nó e, em seguida, realize a atualização do CPLD.
- Após a atualização, o nó será reinicializado e, então, retire-o do modo de manutenção.
- Quando o nó estiver fora desse modo, começará uma operação de recriação e rebalanceamento.
- NOTA: Antes de prosseguir para a atualização do próximo nó do cluster, aguarde a conclusão da operação de recriação e rebalanceamento.
Pré-requisitos
- A versão mínima do BIOS para essa atualização do CPLD é a versão 1.8.2. (recomendam-se as versões 1.10.2 ou posteriores)
- Durante o procedimento de substituição de componentes, o cliente é responsável pelas seguintes tarefas:
- Migração de outros aplicativos do nó, que não o PowerFlex, para outro servidor.
- Desligamento normal do servidor, seguindo o procedimento adequado de desligamento para o sistema operacional em uso.
- Certifique-se de que as seguintes informações estão disponíveis:
- O tipo de nó do PowerFlex: Nó físico ou nó HCI (VMware)
- O intervalo de endereços IP, a sub-rede e o endereço IP do gateway do cluster do PowerFlex e seus nós
- O intervalo de endereços IP, a sub-rede e os endereços IP do gateway da porta do iDRAC no nó (definidos durante o processo de implementação inicial)
- Todas as senhas root e de administrador definidas no servidor e no iDRAC
- Endereço IP e credenciais de log-in do vCenter, se a configuração for HCI
Procedimento detalhado
Etapa 1: Atualize o iDRAC em todos os nós do cluster do PowerFlex.
É possível atualizar o iDRAC desses nós sem reinicializá-los. Abaixo, há o procedimento para atualizar o iDRAC.
Certifique-se de ter feito download da imagem do firmware em uma localização específica do sistema. A versão do firmware do iDRAC é necessária para este procedimento, e o local de download está listado na primeira página do procedimento.
NOTA: Antes de avançar para a próxima etapa do procedimento, certifique-se de atualizar o firmware do iDRAC em todos os nós do cluster.
- Faça log-in na interface web do iDRAC9.
- Acesse Maintenance e clique em System Update. A página Manual Update é exibida.
- Na guia Manual Update, selecione Local como Location Type.
Figura 1: tela de atualização do iDRAC9
- Clique em Choose File, selecione o arquivo de imagem de firmware do componente necessário e clique em Upload.
- Após o carregamento, a seção Update Details exibirá todos os arquivos de firmware carregados no iDRAC e o status deles. Se o arquivo de imagem do firmware for válido e o carregamento tiver sido realizado com sucesso, a coluna Contents exibirá um ícone (+) ao lado do nome do arquivo de imagem do firmware. Expanda o nome para visualizar as informações sobre nome do dispositivo e versão atual e disponível do firmware em Device Name, Current e Available firmware version, respectivamente.
- Selecione o arquivo necessário de firmware do iDRAC.
- A atualização do firmware do iDRAC não requer a reinicialização do sistema host. Clique em Install para iniciar a atualização.
- Para exibir a página Job Queue, clique em Job Queue. Use esta página para visualizar e gerenciar suas atualizações de firmware pendentes. Você pode clicar em OK para atualizar a página atual e visualizar o status da atualização do firmware.
- O controlador de ciclo de vida será reiniciado, e a conexão com o iDRAC será redefinida. Aguarde alguns minutos para fazer log-in no iDRAC.
Nota: Se houver uma falha de conexão, consulte o artigo da KB sobre falhas de conexão do FQDN de HTTP e HTTPS — https://www.dell.com/support/kbdoc/pt-br/000193619
Etapa 2: Verifique se o nó tem uma bateria defeituosa do NVDIMM.
O iDRAC 7.10.50.201 e versões posteriores contêm um código que verifica a carga das células de bateria do NVDIMM a cada 5 segundos e relata o erro abaixo no Log de eventos do sistema (SEL) do iDRAC se a tensão da célula está abaixo do limite de 1,5 V.
“BAT0021: The NVDIMM battery has reached the end of its usable life or has failed”“BAT0017: The NVDIMM battery has failed.”
Se houver alguma das mensagens acima, isso significará que o nó tem uma bateria defeituosa do NVDIMM, que deve ser substituída.
- NOTA: Não continue a atualização do CPLD nesse nó com uma bateria defeituosa do NVDIMM. A reinicialização durante uma atualização do CPLD travará e não armará o NVDIMM por causa da bateria defeituosa.
- NOTA: Solicite uma bateria de reposição do NVDIMM.
Se o iDRAC não relatar um problema, isso significará que a bateria desse nó está boa e não precisa ser substituída. Será possível atualizar o CPLD nesse nó e, depois, avançar para a próxima etapa.
-
Nota: Os PowerFlex Engineered Systems relatarão uma advertência de integridade do nó para qualquer nó que apresente o erro BAT0021. Esse comportamento pode ser usado para identificar baterias NVDIMM com falha após a atualização do iDRAC
-
Nota: Se o evento BAT0017 ou BAT0021 for exibido, mas ocorrer um 3º evento de BAT0016, a bateria NÃO precisará ser substituída!
A engenharia do NVDIMM é aconselhada que, se esse terceiro evento (BAT0016) for encontrado, a bateria não precisará ser substituída.BAT0016 The NVDIMM battery is operating normally.
Se todos os três alertas da bateria (BAT0021, BAT0020 BAT0016) forem vistos em sequência em menos de um minuto, isso deverá ser considerado um alarme falso e a bateria será considerada íntegra e não deverá ser substituída.
Etapa 3: Prepare o nó — Coloque o SDS no modo de manutenção.
- Entre no modo de manutenção seguindo o procedimento adequado da seção abaixo, em PowerFlex versão 4.x ou PowerFlex versão 3.x
- Selecione o modo correto de manutenção do PowerFlex
- Se o nó não tiver uma bateria defeituosa do NVDIMM, o modo de manutenção instantâneo (IMM) será recomendado para atualizar o CPLD.
- Ignore as etapas 4 e 5 (substituição da bateria) e prossiga com o upgrade do BIOS (etapa 6) e do CPLD (etapa 7)
- Se o nó tiver uma bateria defeituosa do NVDIMM, será necessário substituí-la antes de atualizar o CPLD.
- Nesse caso, é preciso colocar o nó no modo de manutenção protegido (PMM) para contabilizar o tempo que a bateria de reposição leva para carregar.
- Se o nó não tiver uma bateria defeituosa do NVDIMM, o modo de manutenção instantâneo (IMM) será recomendado para atualizar o CPLD.
- NOTA: Esse procedimento causa o início de um processo de rebalanceamento; portanto, é recomendável planejar esse procedimento para uma janela de manutenção agendada.
- NOTA: Ao usar o PMM antes da substituição da bateria do NVDIMM (etapas 4 a 5), você poderá permanecer no modo de manutenção PMM para a atualização do BIOS e do CPLD (etapas 6 a 7)
PowerFlex versão 4.x; consulte o Guia de administração do Dell PowerFlex 4.x.
- Se o nó estiver atuando como o MDM principal, siga estas etapas para alternar a propriedade do MDM:
- Se um SDR estiver configurado no nó, coloque-o no modo de manutenção
- Colocar o Storage Data Server (SDS) no modo de manutenção
- Se esse for um nó de HCI (VMware), coloque o ESXi no modo de manutenção após as etapas acima
PowerFlex versão 3.x; consulte o Guia de upgrade do Dell PowerFlex para a versão v3.6.x.
- Colocando o nó no modo de manutenção e desligando
Etapa 4: Substitua a bateria do NVDIMM.
Consulte a documentação do Solve para nós do PowerFlex, que está disponível no link fornecido abaixo, para obter instruções sobre como substituir a bateria do NVDIMM.
Faça download da documentação do SolVe sobre "Bateria do NVDIMM" para o tipo de nó adequado: R650/R750 no 15G.PowerFlex Custom Node > Replacement > 15G > [R650 or R750] > [PowerFlex 3.6 or 4.0] > NVDIMM battery - Linux-based
-
NOTA: Ignore as seções abaixo na documentação sobre como substituir a bateria do NVDIMM.
Remove the storage devices from PowerFlex.
Motivos pelos quais os dispositivos de armazenamento não devem ser removidos:
- A remoção de dispositivos de armazenamento durante esse procedimento causará uma recriação desnecessária de todo o nó, estendendo a manutenção significativamente.
- Como essa é uma reinicialização planejada e não um evento de queda de energia, o subsistema do NVDIMM não depende da energia das baterias para concluir a operação de salvamento. A energia é proveniente das PSUs, mesmo quando as baterias estão com defeito.
- A reinicialização fará com que o sistema relate um erro de bateria do NVDIMM durante a inicialização. Mas os dados no NVDIMM foram salvos, e não há perda de dados.
Etapa 5: Aguarde o carregamento das baterias substituídas
Se você substituiu a bateria do NVDIMM em um nó específico, ligue o sistema. O sistema não inicializará completamente. O BIOS parará de aguardar o carregamento das baterias, pois uma bateria de reposição do NVDIMM pode não ter a carga suficiente necessária para que o sistema proteja os dados do NVDIMM. As baterias podem levar cerca de 60 a 75 minutos para carregar. Você pode tentar reiniciar o sistema após 60-75 minutos, e o nó deve ligar e armar o subsistema do NVDIMM.
- NOTA: Planeje sua janela de manutenção com base nesses 60 a 75 minutos para todos os nós que precisam ter uma bateria de reposição.
Etapa 6: Atualize o BIOS, se necessário
A versão do CPLD usada para corrigir o problema subjacente neste artigo da KB requer um BIOS com, no mínimo, a versão 1.8.2. (Recomendam-se as versões 1.10.2 ou posteriores do BIOS)
As implementações de PowerFlex Custom Nodes exigem versões específicas de drivers, BIOS e firmware validadas e qualificadas pela Dell.
Se a versão atual do BIOS for anterior à 1.8.2, atualize o firmware para a versão mais recente, conforme publicado na Matriz de firmware e drivers dos PowerFlex Custom Nodes (em inglês).
- Certifique-se de que o nó esteja no modo de manutenção. Caso contrário, consulte a 'Etapa 3' para obter instruções.
- Para fazer download da versão do BIOS, consulte a seção "Locais de download" deste artigo da KB
- Nota: Clique em "Older versions" para escolher uma versão para alinhar à matriz de destino.
- Prossiga com o upgrade do BIOS para a versão 1.8.2 ou posterior.
- Procedimento de upgrade do BIOS do Dell PowerEdge para 15G: https://www.dell.com/support/kbdoc/pt-br/000222827/a-dell-technologies-recomenda-fazer-upgrade-do-bios-e-do-idrac9-para-servidores-poweredge-de-15a-geração
Etapa 7: Atualize o CPLD para a versão 1.1.1
Pré-requisitos:
- Certifique-se de que o SDS esteja no modo de manutenção do PowerFlex. Para nós do ESXi, certifique-se de que o ESXi também esteja no modo de manutenção. Caso contrário, consulte a 'Etapa 3' deste artigo para obter instruções.
- Certifique-se de que a imagem do firmware do CPLD esteja disponível no sistema local. Para fazer download da versão adequada do CPLD, consulte a seção "Locais de download" deste artigo da KB.
- A atualização do CPLD acionará uma reinicialização do nó.
Nota:
- Realize a atualização do firmware do CPLD após a atualização do firmware do iDRAC.
- Substitua a bateria do NVDIMM antes de prosseguir com a atualização do firmware do CPLD.
Abaixo, há o procedimento de atualização do CPLD.
- Faça log-in na interface web do iDRAC9.
- Acesse Maintenance e clique em System Update. A página Manual Update é exibida.
- Na guia Manual Update, selecione Local como Location Type.
Figura 1: Tela de atualização do iDRAC9 - Clique em Choose File, selecione o arquivo de imagem de firmware do componente necessário e clique em Upload.
- Após o carregamento, a seção Update Details exibirá todos os arquivos de firmware carregados no iDRAC e o status deles. Se o arquivo de imagem do firmware for válido e o carregamento tiver sido realizado com sucesso, a coluna Contents exibirá um ícone (+) ao lado do nome do arquivo de imagem do firmware. Expanda o nome para visualizar as informações sobre nome do dispositivo e versão atual e disponível do firmware em Device Name, Current e Available firmware version, respectivamente.
- Selecione o arquivo necessário de firmware do CPLD.
- Uma atualização de firmware do CPLD exigirá uma reinicialização do sistema host. Clique em Install para iniciar a atualização.
- Para exibir a página Job Queue, clique em Job Queue. Use esta página para visualizar e gerenciar suas atualizações de firmware pendentes. Você pode clicar em OK para atualizar a página atual e visualizar o status da atualização do firmware.
Etapa 8: Retire o nó do modo de manutenção.
PowerFlex versão 4.x; consulte o Guia de administração do Dell PowerFlex 4.x.
Pré-requisitos: Verifique se você tem o endereço IP e as credenciais de log-in de administrador para acessar o PowerFlex Manager. Se necessário, o cliente pode apresentar as informações necessárias.
-
Ligue o nó, caso ainda não tenha feito isso após a atualização do CPLD. O sistema operacional será inicializado, e todos os processos do PowerFlex começarão automaticamente.
-
Após a ativação do nó, no navegador, faça log-in novamente no PowerFlex Manager como um usuário administrador.
-
Na barra de menu, clique em Monitoring > Alerts e confirme se nenhuma mensagem de desconexão é exibida para um SDS ou um host de SDC, nem para um SDR ou SDT, se aplicável.
- Para um nó do ESXi, siga estas etapas:
- No vSphere Web Client, certifique-se de que o nó seja exibido como ativado e conectado nas exibições "Hosts" e "Clusters".
- Clique no nó com o botão direito e selecione Exit Maintenance Mode.
- Expanda o servidor e selecione a VM de armazenamento (SVM). Se a SVM não ligar automaticamente, ligue-a manualmente.
- Retire o SDS do modo de manutenção:
- Se um SDR estiver configurado no nó, retire-o do modo de manutenção.
PowerFlex versão 3.x; consulte o Guia de upgrade do Dell PowerFlex para a versão v3.6.x.
Pré-requisitos: Certifique-se de que o usuário tenha as seguintes credenciais (disponibilizadas pelo administrador): Endereço IP ou nome do host do servidor de apresentação do PowerFlex, usado para acessar a GUI do PowerFlex
- Ligue o nó, caso ainda não tenha feito isso após a atualização do CPLD. O sistema operacional será inicializado, e todos os processos do PowerFlex começarão automaticamente
- Retire o nó do modo de manutenção: Recoloque o nó em operação (em inglês)
- Se um SDR estiver configurado no nó, retire-o do modo de manutenção.
Etapa 9: Continue para o próximo nó do cluster
É necessário concluir a sequência das etapas 2 a 8 para todos os nós do cluster, um de cada vez. Depois de fazer upgrade de todos os nós, o processo estará concluído