PowerFlex 3.x : Lors de la mise à niveau sans perturbation, le SDS panique et arrête la mise à niveau

Summary: Au cours de la mise à niveau sans perturbation, le SDS peut subir une panique du noyau récuré.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Une mise à niveau de VxFlex OS 3.0.x.x vers PowerFlex 3.5.x.x ou 3.6.0.x
Une panique du noyau roulant du SDS empêche le système de poursuivre la mise à niveau.

Le processus SDS continue de paniquer et de redémarrer avec la trace de pile suivante :

27/07 08:07:25.381223 Panic in file /data/build/workspace/ScaleIO-Common-Job/src/tgt/spef/l2p_sm/l2p_resolver/l2p_resolver_sync_services.c, line 1828, function Resolver_Inter_SyncUnmatchedVto, PID 133106.Panic Expression ALWAYS_ASSERT PANIC_ID_tgt_1588256010820.
/opt/emc/scaleio/sds/bin/sds-3.5.1100.107(mosDbg_PanicPrepare+0x13a) [0x93b62a]
/opt/emc/scaleio/sds/bin/sds-3.5.1100.107(Resolver_Inter_SyncUnmatchedVto+0x69c) [0x643ddc]
/opt/emc/scaleio/sds/bin/sds-3.5.1100.107(Resolver_Inter_SyncOffsetData+0xd2) [0x644082]
/opt/emc/scaleio/sds/bin/sds-3.5.1100.107(Resolver_SyncOffset+0x3e6) [0x6446f6]
/opt/emc/scaleio/sds/bin/sds-3.5.1100.107(Resolver_Sync+0x1e4) [0x645c54]
/opt/emc/scaleio/sds/bin/sds-3.5.1100.107(L2PGateway_Inter_Sync+0x59) [0x6542d9]
/opt/emc/scaleio/sds/bin/sds-3.5.1100.107(L2PGateway_Inter_UpdateRamCopyEx+0x163) [0x901ba3]
/opt/emc/scaleio/sds/bin/sds-3.5.1100.107(L2PGateway_Inter_Update+0x4f7) [0x9060f7]
/opt/emc/scaleio/sds/bin/sds-3.5.1100.107(L2PGateway_Sync+0x64) [0x9073d4]
/opt/emc/scaleio/sds/bin/sds-3.5.1100.107(feIo_L2PGatewayUpdate+0x3d8) [0x90cf98]
 

Cause

Lors d’une reconstruction en amont du système, alors que vous quittez le mode de maintenance instantanée (IMM), un message de synchronisation des données incorrect est envoyé et reçu sur les SDS (PRI) primaire et secondaire (SEC). Par conséquent, le SDS de la SEC redémarre brusquement le service pour éviter une éventuelle incohérence des données.

Il s’agit d’un scénario rare au cours de l’IMM où une E/S de commande d’écriture en échec peut faussement conduire à un contrôle d’intégrité interne (contrôle d’intégrité des données interne qui provoque le blocage du service SDS) lors de la reconstruction après la fin de l’IMM de sortie. L’échec de l’E/S de commande d’écriture se produit avant l’entrée en IMM et pendant l’IMM, une autre E/S a été envoyée à un décalage proche dans le même jeu de données.

Resolution

Mise à niveau automatisée à l’aide d’une passerelle

  1. Arrêtez la mise à niveau à l’aide de l’interface utilisateur de la passerelle.
  2. Supprimez le SDS défaillant du cluster, puis ajoutez-le à nouveau.
  3. Redémarrez la mise à niveau à partir de l’interface utilisateur de la passerelle IM et cochez la case « Autoriser la mise à niveau même lorsque l’état de mise à niveau est déjà en cours ». La mise à niveau doit recommencer et se poursuivre avec les composants non encore mis à niveau : 

Mise à niveau sans perturbation 
 

Mise à niveau manuelle

Option #1

  1. Si le même appareil tombe en panne à chacune des occurrences, mettez ce périphérique hors ligne. Si ce n’est pas le cas, supprimez tous les appareils SDS du SDS.
  2. Attendez la fin de la reconstruction.
  3. Une fois supprimé, mettez à niveau le SDS et ajoutez-le à nouveau au cluster.
  4. Supprimez le SDS suivant qui doit être mis à niveau à partir du cluster, ce qui déclenchera un rééquilibrage.
  5. Une fois supprimé, mettez à niveau le SDS et ajoutez-le à nouveau au cluster.
  6. Laissez le rééquilibrage se poursuivre jusqu’à ce que le système dispose de suffisamment de capacité pour supprimer le SDS suivant qui doit être mis à niveau. Répétez l’opération jusqu’à ce que tous les SDS soient mis à niveau.

Option #2

Utilisez le mode de maintenance protégée (PMM) au lieu d’IMM pour créer une troisième copie complète. Le problème ne devrait pas se produire avec le PMM, par exemple, la boucle d’arrêt du service se produit parce que le SDS se bloque pendant la reconstruction, revient et se répète. Une solution consiste à arrêter le SDS en panne pendant une période suffisamment longue pour que le MDM ordonne une reconstruction vers l’avant plutôt que vers l’arrière. Une fois que l’ensemble de données problématique est reconstruit, le SDS peut être réactivé avec succès.
 

Versions affectées :

VxFlex OS 3.0.x.x
PowerFlex 3.5.x.x
PowerFlex 3.6.0.x-3.6.1.x

 

Correctifs dans la version :

PowerFlex 3.6.2

Additional Information

SCI-62134

Affected Products

PowerFlex rack, PowerFlex Appliance, PowerFlex custom node, PowerFlex Software, VxFlex Ready Node
Article Properties
Article Number: 000212445
Article Type: Solution
Last Modified: 20 Jun 2025
Version:  3
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.