PowerFlex 4.x : Procédure de redémarrage normal du nœud de gestion MVM PFMP

Summary: Cette procédure explique comment effectuer un redémarrage normal sur un nœud de gestion. Ce processus garantit que la plate-forme de gestion PowerFlex (PFMP) reste en cours d’exécution tout au long du processus. La maintenance est effectuée sur un nœud de gestion à la fois. Dans le cadre de cette procédure, MVM1 est le leader postgres. Il est vidangé et redémarré en dernier. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

Remarque : Soyez prudent lorsque vous effectuez cette procédure. Deux nœuds de machine virtuelle de gestion (MVM) doivent être opérationnels pour maintenir la fonctionnalité PFMP.
 
Les commandes de cette procédure sont exécutées à partir d’un shell bash racine. Pour mettre en miroir les étapes ci-dessous, connectez-vous aux MVM à l’aide de delladmin puis exécutez sudo -s pour passer à un nouveau shell racine.

Exemple:
delladmin@pfmp-mvm03:~> whoami
delladmin
delladmin@pfmp-mvm03:~> sudo -s
pfmp-mvm03:/home/delladmin # whoami
root


Procédure :

  1. Répertoriez toutes les instances de base de données Postgres et identifiez le nom du pod avec le rôle Leader :
kubectl exec -n powerflex -c database $(kubectl get pods -n powerflex -l='postgres-operator.crunchydata.com/role=master, postgres-operator.crunchydata.com/instance-set' | grep Running | cut -d' ' -f1) -- sh -c 'patronictl list'
  1. Exécutez la commande suivante pour identifier quel MVM exécute le pod Postgres Leader . Il s’agit du dernier nœud à être vidangé et redémarré :
for x in `kubectl get pods -n powerflex | grep "postgres-ha-cmo" |awk '{print $1}'` ; do echo $x; kubectl get pods -n powerflex $x -o json | grep '"nodeName"' | cut -d ':' -f2 ; echo " "; done
  1. Ouvrez un terminal sur le MVM3. Exécutez la commande suivante :
kubectl get nodes
  1. Étiquette MVM3 pour maintenance :
kubectl label node pfmp-mvm03 cmo.maintenance.mode=true
  1. Vidangez le nœud MVM03 où les pods en cours d’exécution sont correctement exclus du nœud. Les pods planifient et s’exécutent sur un autre nœud. Une fois le processus de purge terminé, le nœud redémarre. Attendez que le nœud revienne.
Remarque : Sous Linux, si vous exécutez deux commandes jointes par & (opérateur ET) et que la première commande échoue (se termine avec un code de sortie différent de zéro), la deuxième commande n’est pas exécutée. Ce comportement est dû à une évaluation de court-circuit dans l’interpréteur de commandes.
 
  1. Exécutez la commande suivante pour vider le nœud :
kubectl drain pfmp-mvm03 --ignore-daemonsets --delete-emptydir-data
  1. Une fois le nœud déchargé, redémarrez-le :
sudo reboot
  1. Établissez une connexion SSH avec MVM02 et exécutez la commande suivante pour surveiller le nœud que vous avez redémarré et atteindre l’ÉTAT Ready :
watch kubectl get nodes
  1. Une fois que MVM03 signale un état Ready, établissez une connexion SSH avec MVM03 et exécutez la commande suivante pour débrancher et retirer l’étiquette de maintenance .
kubectl uncordon pfmp-mvm03 ; kubectl label node pfmp-mvm03 cmo.maintenance.mode-

Remarque : Le « - » après cmo.maintenance.mode dans la commande ci-dessus est très important. N’oubliez pas d’inclure le symbole TIRET . Cela est nécessaire pour retirer l’étiquette du nœud.
 
  1. Patientez 5 minutes, puis exécutez la commande à l’étape 1 pour afficher l’intégrité du cluster de base de données. Vous pouvez répéter les étapes pour le MVM suivant une fois que le résultat correspond à l’exemple de base de données saine ci-dessous. 
  2. Répétez les étapes 3 à 8 sur MVM02, puis MVM01. 
 
Remarque : Lors de l’exécution de cette procédure sur MVM02, utilisez MVM03 pour l’étape 6 afin de surveiller l’état du nœud MVM02. Lorsque vous travaillez sur MVM01, utilisez MVM02 pour l’étape 6 afin de surveiller l’état du nœud MVM01. Les commandes kubectl NE FONCTIONNENT PAS sur un nœud qui n’est pas à l’état Prêt.
 
Remarque : Lorsque vous effectuez cette procédure, l’ensemble de conformité peut passer à l’état ERROR. Connectez-vous à l’interface utilisateur de PFxM, puis cliquez sur Settings >Compliance Versions. Le bundle de conformité doit être resynchronisé s’il se trouve à l’état ERROR.

Lorsque vous avez terminé la procédure sur les trois MVM, exécutez la commande à l’étape 1 pour vérifier l’intégrité de la base de données postgres . Un pod doit être leader et en état d’exécution. Il doit y avoir un décalage de 0 Mo et les deux membres de secours de synchronisation doivent avoir un état de streaming.

Exemple de base de données saine :
+ Cluster: postgres-ha-ha +------------------------------------------+--------------+-----------+----+-----------+
| Member                  | Host                                     | Role         | State     | TL | Lag in MB |
+-------------------------+------------------------------------------+--------------+-----------+----+-----------+
| postgres-ha-cmo1-8t2v-0 | postgres-ha-cmo1-8t2v-0.postgres-ha-pods | Leader       | running   | 10 |           |
| postgres-ha-cmo1-h4hx-0 | postgres-ha-cmo1-h4hx-0.postgres-ha-pods | Sync Standby | streaming | 10 |         0 |
| postgres-ha-cmo1-pb88-0 | postgres-ha-cmo1-pb88-0.postgres-ha-pods | Sync Standby | streaming | 10 |         0 |
+-------------------------+------------------------------------------+--------------+-----------+----+-----------+

Affected Products

PowerFlex appliance R640

Products

PowerFlex rack, VxFlex Ready Nodes, PowerFlex custom node, PowerFlex appliance R650, PowerFlex appliance R6525, PowerFlex appliance R660, PowerFlex appliance R6625, Powerflex appliance R750, PowerFlex appliance R760, PowerFlex appliance R7625 , PowerFlex appliance R740XD, PowerFlex appliance R7525, PowerFlex appliance R840 ...
Article Properties
Article Number: 000225550
Article Type: How To
Last Modified: 19 Jun 2025
Version:  12
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.