PowerFlex 4.6. Несколько модулей pod продолжают перезапускаться

Summary: Несколько модулей pod продолжают перезапускаться во время и после нового развертывания или модернизации до версии 4.6.1 группы ресурсов только для хранилища (SO) и только для вычислений (CO). ...

Acest articol se aplică pentru Acest articol nu se aplică pentru Acest articol nu este legat de un produs specific. Acest articol nu acoperă toate versiunile de produs existente.

Symptoms

Новое развертывание PowerFlex Manager 4.6.1 или модернизация до 4.6.1 с 200+ узлами SO- и CO-узлов 

Вид экрана во время перезагрузки показывает нехватку памяти: 

lack_of_memory 

Воздействие

  • Состояние работоспособности системы нестабильно, пользовательский интерфейс перестает отвечать/недоступен

Cause

Из-за проблемы с программным обеспечением платформы PowerFlex Manager Platform (PFMP) версии 4.6.1 и выше системам с более чем 200 узлами (как средними, так и средними) требуется больше вычислительных ресурсов, чем было заявлено ранее: 28 ядер процессора и 64 ГБ памяти.

Resolution

Процедура выключения питания

  1. Войдите в MVM и выполните следующие команды, чтобы остановить базу данных:
    1. Проверьте состояние базы данных:
      kubectl config set-context default --namespace=$(kubectl get pods -A | grep -m 1 -E 'platform|pgo|helmrepo|docker' | cut -d' ' -f1)
       
      echo $(kubectl get pods -l="postgres-operator.crunchydata.com/control-plane=pgo" --no-headers -o name && kubectl get pods -l="postgres-operator.crunchydata.com/instance" --no-headers -o name) | xargs kubectl get -o wide
       
      kubectl -n powerflex patch $(kubectl -n powerflex get postgrescluster -o name) --type merge --patch '{"spec":{"shutdown":true}}'
       
       
    2. Убедитесь, что база данных выключена.
      echo $(kubectl get pods -l="postgres-operator.crunchydata.com/control-plane=pgo" --no-headers -o name && kubectl get pods -l="postgres-operator.crunchydata.com/instance" --no-headers -o name) | xargs kubectl get -o wide
      
       
       
  2. Выключите питание MVM

 

Обновление ресурсов MVM

Для нового развертывания или модернизации до версии 4.6.1 узлы MVM должны соответствовать дополнительным требованиям к памяти и ЦП.

  • ЦП — 28 ядер
  • Оперативная память — 64 Гбайт
Чтобы получить полную процедуру добавления ресурсов, обратитесь к поставщику.

 

Процедура включения питания

  1. Включите все MVM
     
  2. На каждом MVM выполните следующую команду, чтобы проверить состояние сервиса rke2-server:
    kubectl get nodes
    
     
     
    В зависимости от состояния rke2-server выполните следующие действия:

    Состояние rke2-сервера

    Выполните следующие действия:

    Active

    Перейдите к следующему действию

    Активация

    Повторите команду для проверки состояния сервера rke2, пока он не активен.

    Failed

    Попытайтесь запустить службу, выполнив следующую команду:

    systemctl start rke2-server
    
     
  3. Когда rke2-сервер будет активен на всех MVM, убедитесь, что все узлы находятся в состоянии готовности:
    kubectl get nodes
    
     
     
  4.  Когда узлы будут готовы, перейдите к следующему шагу. Если появится сообщение об ошибке, подождите несколько минут и повторите попытку.
    1. Восстановите базу данных оператора мониторинга кластера (CMO):
      kubectl config set-context default --namespace=$(kubectl get pods -A | grep -m 1 -E 'platform|pgo|helmrepo|docker' | cut -d' ' -f1)
       
      kubectl -n powerflex patch $(kubectl -n powerflex get postgrescluster -o name) --type merge --patch '{"spec":{"shutdown": false}}'
       
       
    2. Проверьте базу данных CMO:
      echo $(kubectl get pods -l="postgres-operator.crunchydata.com/control-plane=pgo" --no-headers -o name && kubectl get pods -l="postgres-operator.crunchydata.com/instance" --no-headers -o name) | xargs kubectl get -o wide
      
       
       
  5. Отслеживайте состояние платформы управления PowerFlex.
    1. Выполните следующую команду, чтобы определить номер порта для утилиты мониторинга платформы управления PowerFlex:
      kubectl get services monitor-app -n powerflex -o jsonpath="{.spec.ports[0].nodePort}{\"\n\"}"
      
       
       
    2. Подождите 20–30 минут и проверьте общее состояние работоспособности платформы управления PowerFlex.
       
  6. Перейдите в http://< node IP>:p ort/, где IP-адрес узла — это IP-адрес управления, настроенный на любом из MVM (не IP-адрес Ingress или PowerFlex Manager).
     
  7. Нажмите на статус PFMP и подождите, пока все записи не станут зелеными.
     
  8. Теперь будет доступен основной пользовательский интерфейс PFMP (иногда может подождать 20–30 минут).

 

Затронутые версии

ПФМП 4.6.1

Исправлено в версии

ПФМП 4.8

Produse afectate

PowerFlex appliance R650, Powerflex appliance R750

Produse

PowerFlex rack, PowerFlex appliance connectivity, PowerFlex appliance R760, PowerFlex custom node
Proprietăți articol
Article Number: 000321671
Article Type: Solution
Ultima modificare: 31 Jul 2025
Version:  5
Găsiți răspunsuri la întrebările dvs. de la alți utilizatori Dell
Servicii de asistență
Verificați dacă dispozitivul dvs. este acoperit de serviciile de asistență.