PowerFlex 4.6で複数のポッドが再起動し続ける

Summary: ストレージ専用(SO)およびコンピューティング専用(CO)リソースグループ(RG)での4.6.1への新規導入中または4.6.1へのアップグレード中および実行後に、複数のポッドが再起動し続けます。

Symptoms

Cause

Resolution

Produse afectate

Acest articol se aplică pentru Acest articol nu se aplică pentru Acest articol nu este legat de un produs specific. Acest articol nu acoperă toate versiunile de produs existente.

Consultați alte resurse

Symptoms

PowerFlex Manager 4.6.1の新規導入、またはSOおよびCOノードの200+ノードを使用した4.6.1へのアップグレード

再起動中の画面ビューにメモリー不足が表示される:

lack_of_memory

問題

システムの正常性状態が不安定になり、UIが応答を停止する/使用できない

Cause

PowerFlex Managerプラットフォーム(PFMP)バージョン4.6.1以降のソフトウェアの問題により、200を超えるノード(SOとCOの両方)を持つシステムには、以前に通知されたよりも多くのコンピューティングリソースが必要です。28個のCPUコアと64 GBのメモリー。

Resolution

電源オフ手順

MVMにログインし、次のコマンドを実行してデータベースを停止します。

データベースの稼働状態を検証します。

kubectl config set-context default --namespace=$(kubectl get pods -A | grep -m 1 -E 'platform|pgo|helmrepo|docker' | cut -d' ' -f1)
 
echo $(kubectl get pods -l="postgres-operator.crunchydata.com/control-plane=pgo" --no-headers -o name && kubectl get pods -l="postgres-operator.crunchydata.com/instance" --no-headers -o name) | xargs kubectl get -o wide
 
kubectl -n powerflex patch $(kubectl -n powerflex get postgrescluster -o name) --type merge --patch '{"spec":{"shutdown":true}}'

データベースがシャットダウンされていることを確認します。

echo $(kubectl get pods -l="postgres-operator.crunchydata.com/control-plane=pgo" --no-headers -o name && kubectl get pods -l="postgres-operator.crunchydata.com/instance" --no-headers -o name) | xargs kubectl get -o wide

MVMの電源を切ります

MVMリソースのアップデート

新規導入または4.6.1へのアップグレードの場合、MVMノードは追加のメモリーとCPUの要件を満たす必要があります。

CPU - 28コア
メモリー - 64 GB

リソースの追加手順の詳細については、ベンダーにお問い合わせください。

電源投入手順

すべてのMVMの電源をオンにします

各MVMで、次のコマンドを実行してrke2-serverサービスのステータスを確認します。

kubectl get nodes

rke2-serverのステータスに応じて、次の手順を実行します。

rke2-serverのステータス	次の手順を実行
アクティブ	次の手順に進む
アクティブ化	コマンドを繰り返して、アクティブになるまでrke2-serverのステータスを確認します。
失敗	次のコマンドを実行して、サービスの開始を試みます。 `systemctl start rke2-server`

すべてのMVMでrke2-serverがアクティブになったら、すべてのノードが準備完了状態であることを確認します。
```
kubectl get nodes
```

ノードの準備ができたら、次の手順に進みます。エラーメッセージが表示された場合は、数分待ってから再試行してください。

クラスター監視オペレーター(CMO)データベースをリストアします。

kubectl config set-context default --namespace=$(kubectl get pods -A | grep -m 1 -E 'platform|pgo|helmrepo|docker' | cut -d' ' -f1)
 
kubectl -n powerflex patch $(kubectl -n powerflex get postgrescluster -o name) --type merge --patch '{"spec":{"shutdown": false}}'

CMOデータベースを確認します。

echo $(kubectl get pods -l="postgres-operator.crunchydata.com/control-plane=pgo" --no-headers -o name && kubectl get pods -l="postgres-operator.crunchydata.com/instance" --no-headers -o name) | xargs kubectl get -o wide

PowerFlex管理プラットフォームのステータスを監視します。
1. 次のコマンドを実行して、PowerFlex管理プラットフォーム監視ユーティリティーのポート番号を特定します。
```
kubectl get services monitor-app -n powerflex -o jsonpath="{.spec.ports[0].nodePort}{\"\n\"}"
```
2. 20分から30分待ってから、PowerFlex管理プラットフォームの全体的な正常性ステータスを確認します。
http://<node IP>:p ort/に移動します。ここで、ノードIPアドレスは、いずれかのMVMで構成されている管理IPアドレスです(IngressまたはPowerFlex ManagerのIPアドレスではありません)。
[PFMP status]をクリックし、すべてのエントリーが緑色に変わるまで待ちます。
これで、PFMPメインUIにアクセスできるようになります(20分から30分待つ場合があります)。

問題が発生するバージョン

PFMPの4.6.1

修正バージョン

PFMPの4.8

Produse afectate

PowerFlex appliance R650, Powerflex appliance R750

Produse

PowerFlex rack, PowerFlex appliance connectivity, PowerFlex appliance R760, PowerFlex custom node

Article Number: 000321671

Article Type: Solution

Ultima modificare: 31 Jul 2025

Version: 5

Verificați dacă dispozitivul dvs. este acoperit de serviciile de asistență.

PowerFlex 4.6で複数のポッドが再起動し続ける

Summary: ストレージ専用(SO)およびコンピューティング専用(CO)リソースグループ(RG)での4.6.1への新規導入中または4.6.1へのアップグレード中および実行後に、複数のポッドが再起動し続けます。

Symptoms

Cause

Resolution

Produse afectate

Symptoms

Cause

Resolution

Produse afectate

Produse

Proprietăți articol

Găsiți răspunsuri la întrebările dvs. de la alți utilizatori Dell

Servicii de asistență

Proprietăți articol

Găsiți răspunsuri la întrebările dvs. de la alți utilizatori Dell

Servicii de asistență

PowerFlex 4.6で複数のポッドが再起動し続ける

Summary: ストレージ専用(SO)およびコンピューティング専用(CO)リソース グループ(RG)での4.6.1への新規導入中または4.6.1へのアップグレード中および実行後に、複数のポッドが再起動し続けます。

Articol detaliat

Symptoms

Cause

Resolution

Produse afectate

Symptoms

Cause

Resolution

Produse afectate

Produse

Proprietăți articol

Găsiți răspunsuri la întrebările dvs. de la alți utilizatori Dell

Servicii de asistență

Proprietăți articol

Găsiți răspunsuri la întrebările dvs. de la alți utilizatori Dell

Servicii de asistență

Summary: ストレージ専用(SO)およびコンピューティング専用(CO)リソースグループ(RG)での4.6.1への新規導入中または4.6.1へのアップグレード中および実行後に、複数のポッドが再起動し続けます。