PowerFlex 4.6 Vários pods continuam reiniciando

Summary: Vários pods continuam reiniciando durante e após uma nova implementação ou upgrade do grupo de recursos (CO) apenas de armazenamento (SO) e apenas de computação (CO) do 4.6.1.

Acest articol se aplică pentru Acest articol nu se aplică pentru Acest articol nu este legat de un produs specific. Acest articol nu acoperă toate versiunile de produs existente.

Symptoms

Nova implementação do PowerFlex Manager 4.6.1 ou upgrade para a versão 4.6.1 com + de 200 nós de SO

e COA exibição da tela durante a reinicialização mostra falta de memória:  

lack_of_memory 

Impacto

  • Estado de integridade do sistema instável e interface do usuário parando de responder/não disponível

Cause

Devido a um problema de software na Plataforma PowerFlex Manager (PFMP) versões 4.6.1 e posteriores, os sistemas com mais de 200 nós (SO e CO) exigem mais recursos de computação do que o anunciado anteriormente: 28 núcleos de CPU e 64 GB de memória.

Resolution

Procedimento de desligamento

  1. Faça log-in em um MVM e execute os seguintes comandos para interromper o banco de dados:
    1. Valide o estado de integridade do banco de dados:
      kubectl config set-context default --namespace=$(kubectl get pods -A | grep -m 1 -E 'platform|pgo|helmrepo|docker' | cut -d' ' -f1)
       
      echo $(kubectl get pods -l="postgres-operator.crunchydata.com/control-plane=pgo" --no-headers -o name && kubectl get pods -l="postgres-operator.crunchydata.com/instance" --no-headers -o name) | xargs kubectl get -o wide
       
      kubectl -n powerflex patch $(kubectl -n powerflex get postgrescluster -o name) --type merge --patch '{"spec":{"shutdown":true}}'
       
       
    2. Valide se o banco de dados está desligado:
      echo $(kubectl get pods -l="postgres-operator.crunchydata.com/control-plane=pgo" --no-headers -o name && kubectl get pods -l="postgres-operator.crunchydata.com/instance" --no-headers -o name) | xargs kubectl get -o wide
      
       
       
  2. Desligar o MVM

 

Atualizar recursos do MVM

Para novas implementações ou upgrades para a versão 4.6.1, os nós MVM teriam que atender aos requisitos adicionais de memória e CPU:

  • CPU - 28 núcleos
  • Memória: 64 GB
Para obter o procedimento completo sobre a adição de recursos, entre em contato com o fornecedor.

 

Procedimento de inicialização

  1. Ligue todos os MVMs
     
  2. Em cada MVM, execute o seguinte comando para verificar o status do serviço rke2-server:
    kubectl get nodes
    
     
     
    Faça o seguinte, dependendo do status do servidor rke2:

    Status do servidor rke2

    Siga estas etapas

    Ativa

    Vá para a próxima etapa

    Ativar

    Repita o comando para verificar o status do servidor rke2 até que esteja ativo.

    Failed

    Tente iniciar o serviço executando o seguinte comando:

    systemctl start rke2-server
    
     
  3. Depois que o rke2-server estiver ativo em todos os MVMs, certifique-se de que todos os nós estejam em um estado pronto:
    kubectl get nodes
    
     
     
  4.  Quando os nós estiverem prontos, vá para a próxima etapa. Se uma mensagem de erro for exibida, aguarde alguns minutos e tente novamente.
    1. Restaure o banco de dados do operador de monitoramento de cluster (CMO):
      kubectl config set-context default --namespace=$(kubectl get pods -A | grep -m 1 -E 'platform|pgo|helmrepo|docker' | cut -d' ' -f1)
       
      kubectl -n powerflex patch $(kubectl -n powerflex get postgrescluster -o name) --type merge --patch '{"spec":{"shutdown": false}}'
       
       
    2. Verifique o banco de dados do CMO:
      echo $(kubectl get pods -l="postgres-operator.crunchydata.com/control-plane=pgo" --no-headers -o name && kubectl get pods -l="postgres-operator.crunchydata.com/instance" --no-headers -o name) | xargs kubectl get -o wide
      
       
       
  5. Monitore o status da plataforma de gerenciamento do PowerFlex:
    1. Execute o seguinte comando para identificar o número da porta do utilitário de monitor da plataforma de gerenciamento do PowerFlex:
      kubectl get services monitor-app -n powerflex -o jsonpath="{.spec.ports[0].nodePort}{\"\n\"}"
      
       
       
    2. Aguarde de 20 a 30 minutos e verifique o status geral de integridade da plataforma de gerenciamento do PowerFlex.
       
  6. Vá para http://< node IP>:p ort/, em que o endereço IP do nó é um endereço IP de gerenciamento configurado em qualquer um dos MVMs (não o endereço IP de entrada ou do PowerFlex Manager).
     
  7. Clique no status da PFMP e aguarde até que todas as entradas fiquem verdes.
     
  8. A interface do usuário principal da PFMP agora estará acessível (às vezes, pode esperar de 20 a 30 minutos).

 

Versões afetadas

PFMP 4.6.1

Correção feita na versão

PFMP 4,8

Produse afectate

PowerFlex appliance R650, Powerflex appliance R750

Produse

PowerFlex rack, PowerFlex appliance connectivity, PowerFlex appliance R760, PowerFlex custom node
Proprietăți articol
Article Number: 000321671
Article Type: Solution
Ultima modificare: 31 Jul 2025
Version:  5
Găsiți răspunsuri la întrebările dvs. de la alți utilizatori Dell
Servicii de asistență
Verificați dacă dispozitivul dvs. este acoperit de serviciile de asistență.