XTremIO : DPG présente deux défaillances de disque SSD simultanées entraînant un impact sur les performances

Summary: Cet article fournit des informations sur la façon dont XtremIO gère deux défaillances simultanées de disques SSD (Solid State Drive) dans un groupe de protection des données (DPG) et explique comment cela peut avoir un impact sur les performances. Il offre également des recommandations sur la façon de réduire l’impact sur les performances pendant la reconstruction du DPG. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Un impact sur les performances est observé lorsqu’un deuxième disque SSD tombe en panne avant que le DPG n’ait terminé la reconstruction après une panne de disque SSD précédente.

Cause

Sur un XtremIO, si un disque SSD tombe en panne, le DPG reconstruit les disques SSD sains restants pour maintenir la protection des données. Le processus de reconstruction DPG est différent pour les défaillances d’un disque SSD et pour deux défaillances simultanées de disque SSD.

Lorsqu’un seul disque SSD tombe en panne :

  • Le système passe dans un seul état dégradé et ne dispose que d’un seul bloc de parité pour restaurer les données.
  • La reconstruction DPG commence à reconstruire les données à partir du disque SSD défaillant sur les disques SSD sains restants pour revenir à un état de bloc de parité double pour la protection des données.
  • Lorsque DPG est en cours de reconstruction après la défaillance d’un disque SSD, le processus de reconstruction s’effectue en arrière-plan et les E/S entrantes restent prioritaires.

Lorsque deux défaillances de disque SSD simultanées se produisent dans le même DPG :

  • Le système passe en état de double dégradation, ce qui signifie qu’il ne reste aucune protection de parité.
  • Le risque de perte de données augmente considérablement, c’est pourquoi le système donne la priorité à la récupération. Cela utilise plus de processeurs afin de reconstruire le DPG plus rapidement.
  • XtremIO donne la priorité aux opérations de reconstruction par rapport aux E/S utilisateur, consommant ainsi les ressources du processeur et de la mémoire pour éviter toute perte de données.
  • Ce type de reconstruction nécessite des mises à jour massives des métadonnées. Il doit calculer la parité pour chaque bande affectée et effectuer des contrôles d’intégrité des données pour s’assurer qu’il n’y a pas de corruption.

Alertes qui peuvent s’afficher lorsque le DPG est en cours de reconstruction :

Nom de l’alerte Code de symptôme Description
rebuild_0_to_20_done XTR0800211 La reconstruction de DPG a démarré.
rebuild_20_to_40_done XTR0800221 La reconstruction de DPG est en cours. Plus de 20 % de la reconstruction a été achevée.
rebuild_40_to_60_done XTR0800231 La reconstruction de DPG est en cours. Plus de 40 % de la reconstruction a été achevée.
rebuild_60_to_80_done XTR0800241 La reconstruction de DPG est en cours. Plus de 60 % de la reconstruction a été achevée.
rebuild_99_done XTR0800251 La reconstruction de DPG est en cours. Plus de 80 % de la reconstruction a été achevée.
rg_state_integrate XTR0800904 Le DPG effectue l’intégration du disque SSD.
ssd_assigning_to_rg XTR0900106 Le disque SSD est en cours d’attribution au DPG.


La commande CLI show-data-protection-groups peut également être exécuté pour vérifier la progression d’une reconstruction DPG :

xmcli (tech)> show-data-protection-groups
Name     Index Cluster-Name   Index State           Num-Of-SSDs Useful-SSD-Space User-Space User-Space-In-Use Rebuild-Progress Preparation-Progress Proactive-Metadata-Loading Rebuild-Prevention Brick-Name Index
X1-DPG-1 1     LAB-XIO001 1     normal          28          97.809T          85.690T    65.344T           0                0                    False                      none               X1         1
X2-DPG-1 3     LAB-XIO001 1     double_degraded 26          97.809T          83.690T    65.359T           0                54                   False                      assigning_disk     X2         2

Resolution

Remarque : Il est important de donner la priorité au remplacement des disques SSD lorsqu’ils tombent en panne. Lors du remplacement d’un disque SSD, attendez que le DPG ait terminé la reconstruction avant de procéder à d’autres remplacements.
 

Lorsque deux disques SSD au sein du même DPG tombent en panne simultanément, les performances peuvent être affectées en raison des ressources consommées pour reconstruire la parité. Il n’existe aucun moyen d’arrêter la reconstruction de DPG, ni aucune commande pour l’accélérer. Toutefois, si le client subit une dégradation significative des performances en raison d’un mode de protection à double dégradation (rg_double_degrade), les actions suivantes peuvent aider à réduire l’impact, si possible :

  1. Suspendez toutes les sauvegardes, réplications ou tâches d’E/S intensives jusqu’à la fin de la reconstruction de DPG.
  2. Si possible, basculez la plupart des hôtes actifs vers un autre stockage jusqu’à ce que la reconstruction de DPG soit terminée.
  3. Si vous utilisez des machines virtuelles, mettez hors tension ou migrez les machines virtuelles, ou mettez les hôtes en mode maintenance.
  4. Si possible, utilisez la QoS ou la régulation côté hôte pour réduire la charge sur la baie pendant la reconstruction.

Une fois la reconstruction de DPG terminée, tout impact sur les performances doit être résolu.

Additional Information

Affected Products

XtremIO, XtremIO X2
Article Properties
Article Number: 000355127
Article Type: Solution
Last Modified: 18 Sep 2025
Version:  3
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.