PowerFlex 4.6 Flere pods fortsetter å starte på nytt

Summary: Flere pods starter på nytt under og etter en ny distribusjon av Storage Only (SO) og Compute Only (CO) Resource Group (RG) eller oppgradering til 4.6.1.

Acest articol se aplică pentru Acest articol nu se aplică pentru Acest articol nu este legat de un produs specific. Acest articol nu acoperă toate versiunile de produs existente.

Symptoms

Ny implementering av PowerFlex Manager 4.6.1 eller oppgradering til 4.6.1 med 200+ noder med SO- og CO-noder 

Skjermvisning under omstart viser mangel på minne: 

lack_of_memory 

Innvirkning

  • Ustabil systemtilstand, og brukergrensesnittet slutter å svare/ikke tilgjengelig

Cause

På grunn av et programvareproblem i PowerFlex Manager Platform (PFMP) versjon 4.6.1 og nyere, krever systemer med over 200 noder (både SO og CO) flere databehandlingsressurser enn tidligere annonsert: 28 CPU-kjerner og 64 GB minne.

Resolution

Prosedyre for avstenging

  1. Logg på en MVM, og kjør følgende kommandoer for å stoppe databasen:
    1. Valider tilstandstilstand for database:
      kubectl config set-context default --namespace=$(kubectl get pods -A | grep -m 1 -E 'platform|pgo|helmrepo|docker' | cut -d' ' -f1)
       
      echo $(kubectl get pods -l="postgres-operator.crunchydata.com/control-plane=pgo" --no-headers -o name && kubectl get pods -l="postgres-operator.crunchydata.com/instance" --no-headers -o name) | xargs kubectl get -o wide
       
      kubectl -n powerflex patch $(kubectl -n powerflex get postgrescluster -o name) --type merge --patch '{"spec":{"shutdown":true}}'
       
       
    2. Kontroller at databasen er lukket:
      echo $(kubectl get pods -l="postgres-operator.crunchydata.com/control-plane=pgo" --no-headers -o name && kubectl get pods -l="postgres-operator.crunchydata.com/instance" --no-headers -o name) | xargs kubectl get -o wide
      
       
       
  2. Slå av MVM

 

Oppdatere MVM-ressurser

For nye distribusjoner eller oppgraderinger til 4.6.1 må MVM-nodene oppfylle kravene til ekstra minne og CPU:

  • CPU – 28 kjerner
  • Minne – 64 GB
Hvis du vil ha den fullstendige fremgangsmåten for å legge til ressurser, kontakter du leverandøren.

 

Fremgangsmåte for å slå på

  1. Slå på alle MVM-er
     
  2. På hver MVM kjører du følgende kommando for å kontrollere statusen til rke2-servertjenesten:
    kubectl get nodes
    
     
     
    Utfør følgende, avhengig av rke2-serverstatus:

    Status for rke2-tjener

    Gjør følgende

    Aktiv

    Gå til neste trinn

    Aktivere

    Gjenta kommandoen for å kontrollere status for rke2-server til den er aktiv.

    Failed

    Prøv å starte tjenesten ved å kjøre følgende kommando:

    systemctl start rke2-server
    
     
  3. Når rke2-serveren er aktiv på alle MVM-ene, må du sørge for at alle nodene er i en klar tilstand:
    kubectl get nodes
    
     
     
  4.  Når nodene er klare, går du videre til neste trinn. Hvis det vises en feilmelding, venter du noen minutter og prøver på nytt.
    1. Gjenopprette databasen for Cluster Monitoring Operator (CMO):
      kubectl config set-context default --namespace=$(kubectl get pods -A | grep -m 1 -E 'platform|pgo|helmrepo|docker' | cut -d' ' -f1)
       
      kubectl -n powerflex patch $(kubectl -n powerflex get postgrescluster -o name) --type merge --patch '{"spec":{"shutdown": false}}'
       
       
    2. Kontrollere CMO-databasen:
      echo $(kubectl get pods -l="postgres-operator.crunchydata.com/control-plane=pgo" --no-headers -o name && kubectl get pods -l="postgres-operator.crunchydata.com/instance" --no-headers -o name) | xargs kubectl get -o wide
      
       
       
  5. Overvåk statusen for PowerFlex-administrasjonsplattformen:
    1. Kjør følgende kommando for å identifisere portnummeret til PowerFlex Management Platform Monitor-verktøyet:
      kubectl get services monitor-app -n powerflex -o jsonpath="{.spec.ports[0].nodePort}{\"\n\"}"
      
       
       
    2. Vent i 20–30 minutter, og kontroller den generelle tilstandsstatusen til administrasjonsplattformen for PowerFlex.
       
  6. Gå til http://< node IP>:p ort/, der node-IP-adressen er en administrasjons-IP-adresse som er konfigurert på en av MVM-ene (ikke Ingress- eller PowerFlex Manager-IP-adressen).
     
  7. Klikk på PFMP-status og vent til alle oppføringene blir grønne.
     
  8. PFMP-hovedgrensesnittet vil nå være tilgjengelig (noen ganger kan det vente i 20 til 30 minutter).

 

Berørte versjoner

PFMP 4.6.1

Løst i versjon

PFMP 4.8

Produse afectate

PowerFlex appliance R650, Powerflex appliance R750

Produse

PowerFlex rack, PowerFlex appliance connectivity, PowerFlex appliance R760, PowerFlex custom node
Proprietăți articol
Article Number: 000321671
Article Type: Solution
Ultima modificare: 31 Jul 2025
Version:  5
Găsiți răspunsuri la întrebările dvs. de la alți utilizatori Dell
Servicii de asistență
Verificați dacă dispozitivul dvs. este acoperit de serviciile de asistență.