XtremIO: DPG heeft twee gelijktijdige SSD-storingen die gevolgen hebben voor de prestaties

Summary: Dit artikel bevat informatie over hoe XtremIO omgaat met twee gelijktijdige storingen van solid state drives (SSD) in een Data Protection Group (DPG) en legt uit hoe dit de prestaties kan beïnvloeden. Het bevat ook enkele aanbevelingen over hoe u de impact op de prestaties kunt verminderen terwijl de DPG opnieuw wordt opgebouwd. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Er wordt een prestatie-impact waargenomen wanneer een tweede SSD uitvalt voordat de DPG een heropbouw van een eerdere SSD-fout voltooit.

Cause

Als bij een XtremIO één SSD uitvalt, bouwt de DPG opnieuw op op de resterende gezonde SSD's om de databescherming te behouden. Het DPG-heropbouwproces is anders voor enkele SSD-storingen dan voor twee gelijktijdige SSD-fouten.

Als slechts één SSD uitvalt:

  • Het systeem komt in een enkele gedegradeerde status en heeft slechts één pariteitsblok om de data te herstellen.
  • DPG rebuild begint met het opnieuw opbouwen van de data van de defecte SSD op de resterende gezonde SSD's om terug te keren naar een dubbele pariteitsblokstatus voor databescherming.
  • Wanneer DPG opnieuw opbouwt vanaf een enkele SSD-fout, wordt het heropbouwproces op de achtergrond uitgevoerd en heeft inkomende I/O nog steeds prioriteit.

Wanneer twee gelijktijdige SSD-storingen in dezelfde DPG het volgende doen:

  • Het systeem gaat in een dubbele gedegradeerde status terecht, wat betekent dat er geen pariteitsbescherming meer is.
  • Het risico op dataverlies neemt dramatisch toe, dus het systeem geeft prioriteit aan herstel. Dit gebruikt meer CPU's om de DPG sneller opnieuw op te bouwen.
  • XtremIO geeft prioriteit aan rebuild-bewerkingen boven gebruikers-I/O, waarbij de CPU en geheugenbronnen worden verbruikt om dataverlies te voorkomen.
  • Dit type heropbouw vereist enorme metadata-updates. Het moet de pariteit berekenen voor elke getroffen stripe en data-integriteitscontroles uitvoeren om ervoor te zorgen dat er geen beschadiging is.

Waarschuwingen die kunnen worden weergegeven wanneer de DPG opnieuw wordt opgebouwd:

Naam waarschuwing Symptoomcode Beschrijving
rebuild_0_to_20_done XTR0800211 De heropbouw van DPG is gestart.
rebuild_20_to_40_done XTR0800221 De heropbouw van DPG is in volle gang. Meer dan 20 procent van de verbouwing is voltooid.
rebuild_40_to_60_done XTR0800231 De heropbouw van DPG is in volle gang. Meer dan 40 procent van de verbouwing is voltooid.
rebuild_60_to_80_done XTR0800241 De heropbouw van DPG is in volle gang. Meer dan 60 procent van de verbouwing is voltooid.
rebuild_99_done XTR0800251 De heropbouw van DPG is in volle gang. Meer dan 80 procent van de verbouwing is voltooid.
rg_state_integrate XTR0800904 De DPG voert SSD-integratie uit.
ssd_assigning_to_rg XTR0900106 SSD wordt toegewezen aan de DPG.


Het CLI-commando show-data-protection-groups kan ook worden uitgevoerd om de voortgang van een DPG-rebuild te controleren:

xmcli (tech)> show-data-protection-groups
Name     Index Cluster-Name   Index State           Num-Of-SSDs Useful-SSD-Space User-Space User-Space-In-Use Rebuild-Progress Preparation-Progress Proactive-Metadata-Loading Rebuild-Prevention Brick-Name Index
X1-DPG-1 1     LAB-XIO001 1     normal          28          97.809T          85.690T    65.344T           0                0                    False                      none               X1         1
X2-DPG-1 3     LAB-XIO001 1     double_degraded 26          97.809T          83.690T    65.359T           0                54                   False                      assigning_disk     X2         2

Resolution

OPMERKING: Het is belangrijk om prioriteit te geven aan het vervangen van SSD's wanneer ze mislukken. Wacht bij het vervangen van een SSD tot de DPG de heropbouw heeft voltooid voordat u verdergaat met eventuele aanvullende vervangingen.
 

Wanneer twee SSD's binnen dezelfde DPG tegelijkertijd defect raken, kunnen de prestaties worden beïnvloed door de resources die worden verbruikt om de pariteit opnieuw op te bouwen. Er is geen manier om de heropbouw van DPG te stoppen, noch is er een opdracht om deze te versnellen. Als de klant echter aanzienlijke verminderde prestaties ervaart als gevolg van de dubbel verslechterde beveiligingsmodus (rg_double_degrade), kunnen de volgende maatregelen helpen om de gevolgen te beperken, indien mogelijk:

  1. Pauzeer alle back-ups, replicatie of intensieve I/O-taken totdat de DPG-heropbouw is voltooid.
  2. Voer indien mogelijk een failover uit over de meeste actieve hosts naar andere storage totdat de DPG-heropbouw is voltooid.
  3. Als u VM's gebruikt, schakelt u VM's uit of migreert u deze of zet u hosts in de onderhoudsmodus.
  4. Gebruik indien mogelijk QoS of host-side throttling om de belasting van de array tijdens het opnieuw bouwen te verminderen.

Zodra de DPG-heropbouw is voltooid, zouden alle gerelateerde gevolgen voor de prestaties moeten zijn opgelost.

Additional Information

Affected Products

XtremIO, XtremIO X2
Article Properties
Article Number: 000355127
Article Type: Solution
Last Modified: 18 Sep 2025
Version:  3
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.