XTremIO : DPG présente deux défaillances de disque SSD simultanées entraînant un impact sur les performances
Summary: Cet article fournit des informations sur la façon dont XtremIO gère deux défaillances simultanées de disques SSD (Solid State Drive) dans un groupe de protection des données (DPG) et explique comment cela peut avoir un impact sur les performances. Il offre également des recommandations sur la façon de réduire l’impact sur les performances pendant la reconstruction du DPG. ...
Symptoms
Un impact sur les performances est observé lorsqu’un deuxième disque SSD tombe en panne avant que le DPG n’ait terminé la reconstruction après une panne de disque SSD précédente.
Cause
Sur un XtremIO, si un disque SSD tombe en panne, le DPG reconstruit les disques SSD sains restants pour maintenir la protection des données. Le processus de reconstruction DPG est différent pour les défaillances d’un disque SSD et pour deux défaillances simultanées de disque SSD.
Lorsqu’un seul disque SSD tombe en panne :
- Le système passe dans un seul état dégradé et ne dispose que d’un seul bloc de parité pour restaurer les données.
- La reconstruction DPG commence à reconstruire les données à partir du disque SSD défaillant sur les disques SSD sains restants pour revenir à un état de bloc de parité double pour la protection des données.
- Lorsque DPG est en cours de reconstruction après la défaillance d’un disque SSD, le processus de reconstruction s’effectue en arrière-plan et les E/S entrantes restent prioritaires.
Lorsque deux défaillances de disque SSD simultanées se produisent dans le même DPG :
- Le système passe en état de double dégradation, ce qui signifie qu’il ne reste aucune protection de parité.
- Le risque de perte de données augmente considérablement, c’est pourquoi le système donne la priorité à la récupération. Cela utilise plus de processeurs afin de reconstruire le DPG plus rapidement.
- XtremIO donne la priorité aux opérations de reconstruction par rapport aux E/S utilisateur, consommant ainsi les ressources du processeur et de la mémoire pour éviter toute perte de données.
- Ce type de reconstruction nécessite des mises à jour massives des métadonnées. Il doit calculer la parité pour chaque bande affectée et effectuer des contrôles d’intégrité des données pour s’assurer qu’il n’y a pas de corruption.
Alertes qui peuvent s’afficher lorsque le DPG est en cours de reconstruction :
| Nom de l’alerte | Code de symptôme | Description |
|---|---|---|
rebuild_0_to_20_done |
XTR0800211 |
La reconstruction de DPG a démarré. |
rebuild_20_to_40_done |
XTR0800221 |
La reconstruction de DPG est en cours. Plus de 20 % de la reconstruction a été achevée. |
rebuild_40_to_60_done |
XTR0800231 |
La reconstruction de DPG est en cours. Plus de 40 % de la reconstruction a été achevée. |
rebuild_60_to_80_done |
XTR0800241 |
La reconstruction de DPG est en cours. Plus de 60 % de la reconstruction a été achevée. |
rebuild_99_done |
XTR0800251 |
La reconstruction de DPG est en cours. Plus de 80 % de la reconstruction a été achevée. |
rg_state_integrate |
XTR0800904 |
Le DPG effectue l’intégration du disque SSD. |
ssd_assigning_to_rg |
XTR0900106 |
Le disque SSD est en cours d’attribution au DPG. |
La commande CLI show-data-protection-groups peut également être exécuté pour vérifier la progression d’une reconstruction DPG :
xmcli (tech)> show-data-protection-groups Name Index Cluster-Name Index State Num-Of-SSDs Useful-SSD-Space User-Space User-Space-In-Use Rebuild-Progress Preparation-Progress Proactive-Metadata-Loading Rebuild-Prevention Brick-Name Index X1-DPG-1 1 LAB-XIO001 1 normal 28 97.809T 85.690T 65.344T 0 0 False none X1 1 X2-DPG-1 3 LAB-XIO001 1 double_degraded 26 97.809T 83.690T 65.359T 0 54 False assigning_disk X2 2
Resolution
Lorsque deux disques SSD au sein du même DPG tombent en panne simultanément, les performances peuvent être affectées en raison des ressources consommées pour reconstruire la parité. Il n’existe aucun moyen d’arrêter la reconstruction de DPG, ni aucune commande pour l’accélérer. Toutefois, si le client subit une dégradation significative des performances en raison d’un mode de protection à double dégradation (rg_double_degrade), les actions suivantes peuvent aider à réduire l’impact, si possible :
- Suspendez toutes les sauvegardes, réplications ou tâches d’E/S intensives jusqu’à la fin de la reconstruction de DPG.
- Si possible, basculez la plupart des hôtes actifs vers un autre stockage jusqu’à ce que la reconstruction de DPG soit terminée.
- Si vous utilisez des machines virtuelles, mettez hors tension ou migrez les machines virtuelles, ou mettez les hôtes en mode maintenance.
- Si possible, utilisez la QoS ou la régulation côté hôte pour réduire la charge sur la baie pendant la reconstruction.
Une fois la reconstruction de DPG terminée, tout impact sur les performances doit être résolu.
Additional Information
Articles connexes :
(Il peut être nécessaire de se connecter en tant qu’utilisateur du support Dell enregistré pour consulter ces articles.)