PowerFlex 4.6 Flere pods bliver ved med at genstarte

Summary: Flere pods bliver ved med at genstarte under og efter en ny implementering eller opgradering til 4.6.1 (Storage Only (SO) og CO (Compute Only (CO) Resource Group (RG).

Acest articol se aplică pentru Acest articol nu se aplică pentru Acest articol nu este legat de un produs specific. Acest articol nu acoperă toate versiunile de produs existente.

Symptoms

Ny implementering af PowerFlex Manager 4.6.1 eller opgradering til 4.6.1 med 200+ SO- og CO-noder 

Skærmvisning under genstart viser mangel på hukommelse: 

lack_of_memory 

Påvirkning

  • Ustabil systemtilstand, og brugergrænsefladen holder op med at svare/er ikke tilgængelig

Cause

På grund af et softwareproblem i PowerFlex Manager Platform (PFMP) version 4.6.1 og nyere kræver systemer med over 200 noder (både SO og CO) flere computerressourcer end tidligere annonceret: 28 CPU-kerner og 64 GB hukommelse.

Resolution

Procedure for slukning

  1. Log på en MVM, og kør følgende kommandoer for at stoppe databasen:
    1. Valider databasens tilstand:
      kubectl config set-context default --namespace=$(kubectl get pods -A | grep -m 1 -E 'platform|pgo|helmrepo|docker' | cut -d' ' -f1)
       
      echo $(kubectl get pods -l="postgres-operator.crunchydata.com/control-plane=pgo" --no-headers -o name && kubectl get pods -l="postgres-operator.crunchydata.com/instance" --no-headers -o name) | xargs kubectl get -o wide
       
      kubectl -n powerflex patch $(kubectl -n powerflex get postgrescluster -o name) --type merge --patch '{"spec":{"shutdown":true}}'
       
       
    2. Bekræft, at databasen er lukket ned:
      echo $(kubectl get pods -l="postgres-operator.crunchydata.com/control-plane=pgo" --no-headers -o name && kubectl get pods -l="postgres-operator.crunchydata.com/instance" --no-headers -o name) | xargs kubectl get -o wide
      
       
       
  2. Sluk for MVM en

 

Opdater MVM-ressourcer

For nye implementeringer eller opgraderinger til 4.6.1 skal MVM-noderne opfylde de ekstra hukommelses- og CPU-krav:

  • CPU – 28 kerner
  • Hukommelse – 64 GB
Kontakt leverandøren for at få hele proceduren for tilføjelse af ressourcer.

 

Procedure for tænding

  1. Tænd for alle MVM'er
     
  2. Kør følgende kommando på hver MVM for at kontrollere status for rke2-servertjenesten:
    kubectl get nodes
    
     
     
    Gør følgende afhængigt af rke2-serverstatus:

    Status på rke2-serveren

    Gør følgende:

    Aktiv

    Gå til næste trin

    Aktivering

    Gentag kommandoen for at kontrollere status for rke2-serveren, indtil den er aktiv.

    Mislykket

    Forsøg at starte tjenesten ved at køre følgende kommando:

    systemctl start rke2-server
    
     
  3. Når rke2-serveren er aktiv på alle MVM'erne, skal du sikre dig, at alle noder er i klar tilstand:
    kubectl get nodes
    
     
     
  4.  Når noderne er klar, skal du gå til næste trin. Hvis der vises en fejlmeddelelse, skal du vente et par minutter og prøve igen.
    1. Gendan CMO-databasen (Cluster Monitoring Operator):
      kubectl config set-context default --namespace=$(kubectl get pods -A | grep -m 1 -E 'platform|pgo|helmrepo|docker' | cut -d' ' -f1)
       
      kubectl -n powerflex patch $(kubectl -n powerflex get postgrescluster -o name) --type merge --patch '{"spec":{"shutdown": false}}'
       
       
    2. Kontroller CMO-databasen:
      echo $(kubectl get pods -l="postgres-operator.crunchydata.com/control-plane=pgo" --no-headers -o name && kubectl get pods -l="postgres-operator.crunchydata.com/instance" --no-headers -o name) | xargs kubectl get -o wide
      
       
       
  5. Overvåg status for PowerFlex-administrationsplatformen:
    1. Kør følgende kommando for at identificere portnummeret for overvågningshjælpeprogrammet til PowerFlex-administrationsplatformen:
      kubectl get services monitor-app -n powerflex -o jsonpath="{.spec.ports[0].nodePort}{\"\n\"}"
      
       
       
    2. Vent i 20-30 minutter, og kontrollér PowerFlex-administrationsplatformens overordnede sundhedstilstand.
       
  6. Gå til http://< node IP>:p ort/, hvor nodens IP-adresse er en administrations-IP-adresse, der er konfigureret på en af MVM'erne (ikke IP-adressen for indgående data eller PowerFlex Manager).
     
  7. Klik på PFMP-status, og vent på, at alle poster bliver grønne.
     
  8. PFMP's primære brugergrænseflade vil nu være tilgængelig (nogle gange kan det vente i 20 til 30 minutter).

 

Påvirkede versioner

PFMP 4.6.1

Fast i version

PFMP 4.8

Produse afectate

PowerFlex appliance R650, Powerflex appliance R750

Produse

PowerFlex rack, PowerFlex appliance connectivity, PowerFlex appliance R760, PowerFlex custom node
Proprietăți articol
Article Number: 000321671
Article Type: Solution
Ultima modificare: 31 Jul 2025
Version:  5
Găsiți răspunsuri la întrebările dvs. de la alți utilizatori Dell
Servicii de asistență
Verificați dacă dispozitivul dvs. este acoperit de serviciile de asistență.