PowerFlex 4.x: Verfahren für einen ordnungsgemäßen Neustart des PFMP-MVM-Management-Node

Summary: In diesem Verfahren wird beschrieben, wie Sie einen ordnungsgemäßen Neustart auf einem Management-Node durchführen. Dieser Prozess stellt sicher, dass die PowerFlex Management Platform (PFMP) während des gesamten Prozesses ausgeführt wird. Die Wartung wird jeweils auf einem Management-Node gleichzeitig durchgeführt. Im Rahmen dieses Verfahrens ist MVM1 der Postgres-Leader. Es wird entladen und zuletzt neu gestartet. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

Hinweis: Seien Sie vorsichtig, wenn Sie dieses Verfahren durchführen. Zwei Management-VM-Nodes (MVM) müssen betriebsbereit sein, um die PFMP-Funktionalität aufrechtzuerhalten.
 
Die Befehle in diesem Verfahren werden von einer Root-Bash-Shell ausgeführt. Um die folgenden Schritte zu spiegeln, melden Sie sich bei den MVMs an, indem Sie delladmin Führen Sie dann Folgendes aus: sudo -s , um zu einer neuen Root-Shell zu wechseln.

Beispiel:
delladmin@pfmp-mvm03:~> whoami
delladmin
delladmin@pfmp-mvm03:~> sudo -s
pfmp-mvm03:/home/delladmin # whoami
root


Verfahren:

  1. Listen Sie alle Postgres-Datenbankinstanzen auf und identifizieren Sie den Pod-Namen mit der Leader-Rolle:
kubectl exec -n powerflex -c database $(kubectl get pods -n powerflex -l='postgres-operator.crunchydata.com/role=master, postgres-operator.crunchydata.com/instance-set' | grep Running | cut -d' ' -f1) -- sh -c 'patronictl list'
  1. Führen Sie den folgenden Befehl aus, um zu ermitteln, auf welchem MVM der Postgres-Leader-Pod ausgeführt wird . Dies ist der letzte Node, der entladen und neu gestartet wird:
for x in `kubectl get pods -n powerflex | grep "postgres-ha-cmo" |awk '{print $1}'` ; do echo $x; kubectl get pods -n powerflex $x -o json | grep '"nodeName"' | cut -d ':' -f2 ; echo " "; done
  1. Öffnen Sie ein Terminal für MVM3. Führen Sie den folgenden Befehl aus:
kubectl get nodes
  1. Etikettieren Sie MVM3 für die Wartung:
kubectl label node pfmp-mvm03 cmo.maintenance.mode=true
  1. Entladen Sie den Node MVM03, wobei ausgeführte Pods ordnungsgemäß vom Node entfernt werden. Die Pods werden auf einem anderen Node geplant und ausgeführt. Wenn der Entladungsprozess abgeschlossen ist, wird der Node neu gestartet. Warten Sie, bis der Node wieder hochgefahren ist.
Hinweis: Wenn Sie unter Linux zwei Befehle ausführen, die von & & (UND-Operator) verbunden sind, und der erste Befehl fehlschlägt (mit einem Exit-Code ungleich Null beendet wird), wird der zweite Befehl nicht ausgeführt. Dieses Verhalten ist auf eine Kurzschlussauswertung in der Hülle zurückzuführen.
 
  1. Führen Sie den folgenden Befehl aus , um den Node zu entladen:
kubectl drain pfmp-mvm03 --ignore-daemonsets --delete-emptydir-data
  1. Nachdem der Node entladen wurde, starten Sie ihn neu:
sudo reboot
  1. Stellen Sie eine SSH-Verbindung zu MVM02 her und führen Sie den folgenden Befehl aus, um den neu gestarteten Node zu überwachen, damit er den Status "Ready" erreicht:
watch kubectl get nodes
  1. Sobald MVM03 den Status "Bereit" meldet, stellen Sie eine SSH-Verbindung zu MVM03 her und führen Sie den folgenden Befehl aus, um die Sperrung aufzuheben und die Wartungsetikette zu entfernen .
kubectl uncordon pfmp-mvm03 ; kubectl label node pfmp-mvm03 cmo.maintenance.mode-

Hinweis: Das "-" nach cmo.maintenance.mode Im obigen Befehl ist sehr wichtig. Vergessen Sie nicht, das Bindestrich-Symbol einzufügen. Dies ist erforderlich, um das Etikett vom Node zu entfernen.
 
  1. Warten Sie 5 Minuten und führen Sie dann den Befehl in Schritt 1 aus, um die Integrität des Datenbankclusters anzuzeigen. Sie können die Schritte für den nächsten MVM wiederholen, sobald die Ausgabe mit dem folgenden Beispiel für eine funktionierende Datenbank übereinstimmt. 
  2. Wiederholen Sie die Schritte 3 bis 8 auf MVM02 und dann auf MVM01. 
 
Hinweis: Wenn Sie dieses Verfahren auf MVM02 durchführen, verwenden Sie MVM03 für Schritt 6, um den MVM02-Node-Status zu überwachen. Wenn Sie mit MVM01 arbeiten, verwenden Sie MVM02 für Schritt 6, um den MVM01-Node-Status zu überwachen. Kubectl-Befehle funktionieren NICHT auf einem Node, der sich nicht im Status "Ready" befindet.
 
Hinweis: Wenn Sie dieses Verfahren durchführen, wechselt das Compliance-Bundle möglicherweise in den Status ERROR. Melden Sie sich bei der PFxM-Benutzeroberfläche an und klicken Sie auf Settings >Compliance Versions. Das Compliance-Bundle muss neu synchronisiert werden, wenn es sich im Status ERROR befindet.

Wenn Sie das Verfahren auf allen drei MVMs abgeschlossen haben, führen Sie den Befehl in Schritt 1 aus, um die Integrität der Postgres-Datenbank zu überprüfen. Ein Pod sollte der Leader sein und sich im Status "Running" befinden. Es sollte eine Verzögerung von 0 MB vorliegen und beide Sync-Standby-Mitglieder sollten den Status " Streaming" aufweisen.

Beispiel für eine funktionsfähige Datenbank:
+ Cluster: postgres-ha-ha +------------------------------------------+--------------+-----------+----+-----------+
| Member                  | Host                                     | Role         | State     | TL | Lag in MB |
+-------------------------+------------------------------------------+--------------+-----------+----+-----------+
| postgres-ha-cmo1-8t2v-0 | postgres-ha-cmo1-8t2v-0.postgres-ha-pods | Leader       | running   | 10 |           |
| postgres-ha-cmo1-h4hx-0 | postgres-ha-cmo1-h4hx-0.postgres-ha-pods | Sync Standby | streaming | 10 |         0 |
| postgres-ha-cmo1-pb88-0 | postgres-ha-cmo1-pb88-0.postgres-ha-pods | Sync Standby | streaming | 10 |         0 |
+-------------------------+------------------------------------------+--------------+-----------+----+-----------+

Affected Products

PowerFlex appliance R640

Products

PowerFlex rack, VxFlex Ready Nodes, PowerFlex custom node, PowerFlex appliance R650, PowerFlex appliance R6525, PowerFlex appliance R660, PowerFlex appliance R6625, Powerflex appliance R750, PowerFlex appliance R760, PowerFlex appliance R7625 , PowerFlex appliance R740XD, PowerFlex appliance R7525, PowerFlex appliance R840 ...
Article Properties
Article Number: 000225550
Article Type: How To
Last Modified: 19 Jun 2025
Version:  12
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.