XtremIO: DPG har to samtidige SSD-feil som forårsaker ytelsespåvirkning

Summary: Denne artikkelen inneholder informasjon om hvordan XtremIO håndterer to tilfeller av feil på SSD (Solid State Drive) samtidig i en Data Protection Group (DPG), og forklarer hvordan det kan påvirke ytelsen. Den gir også noen anbefalinger om hvordan man kan bidra til å redusere ytelsespåvirkningen mens DPG gjenoppbygges. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

En ytelsespåvirkning oppstår når en annen SSD svikter før DPG fullfører en gjenoppbygging fra en tidligere SSD-feil.

Cause

Hvis en SSD svikter på en XtremIO, gjenoppbygger DPG på de gjenværende fungerende SSD-ene for å opprettholde databeskyttelsen. DPG-gjenoppbyggingsprosessen er forskjellig for enkelt SSD-feil enn for to samtidige SSD-feil.

Når bare én SSD svikter:

  • Systemet går inn i én enkelt degradert tilstand, og har bare én paritetsblokk for å gjenopprette dataene.
  • DPG-gjenoppbygging starter gjenoppbyggingen av dataene fra den defekte SSD-en på de gjenværende sunne SSD-ene for å gå tilbake til en dobbel paritetsblokkstatus for databeskyttelse.
  • Når DPG gjenoppbygges fra en enkelt SSD-feil, utføres gjenoppbyggingsprosessen i bakgrunnen, og innkommende I/O prioriteres fortsatt.

Når to samtidige SSD-feil i samme DPG:

  • Systemet går inn i en dobbel degradert tilstand, noe som betyr at ingen paritetsbeskyttelse forblir.
  • Risikoen for tap av data øker dramatisk, så systemet prioriterer gjenoppretting. Dette bruker flere CPUer for å gjenoppbygge DPG raskere.
  • XtremIO prioriterer gjenoppbyggingsoperasjoner over bruker-I/O, og forbruker CPU- og minneressursene for å unngå tap av data.
  • Denne typen gjenoppbygging krever massive metadataoppdateringer. Den må beregne paritet for hver berørte stripe og utfører kontroller av dataintegritet for å sikre at det ikke forekommer skade.

Varsler som kan vises når DPG gjenoppbygges:

Varselsnavn Symptomkode Beskrivelse
rebuild_0_to_20_done XTR0800211 Gjenoppbyggingen av DPG har startet.
rebuild_20_to_40_done XTR0800221 DPG-gjenoppbygging pågår. Mer enn 20 prosent av gjenoppbyggingen er fullført.
rebuild_40_to_60_done XTR0800231 DPG-gjenoppbygging pågår. Mer enn 40 prosent av gjenoppbyggingen er fullført.
rebuild_60_to_80_done XTR0800241 DPG-gjenoppbygging pågår. Mer enn 60 prosent av gjenoppbyggingen er fullført.
rebuild_99_done XTR0800251 DPG-gjenoppbygging pågår. Mer enn 80 prosent av gjenoppbyggingen er fullført.
rg_state_integrate XTR0800904 DPG utfører SSD-integrering.
ssd_assigning_to_rg XTR0900106 SSD tilordnes DPG.


CLI-kommandoen show-data-protection-groups kan også kjøres for å kontrollere fremdriften til en DPG-gjenoppbygging:

xmcli (tech)> show-data-protection-groups
Name     Index Cluster-Name   Index State           Num-Of-SSDs Useful-SSD-Space User-Space User-Space-In-Use Rebuild-Progress Preparation-Progress Proactive-Metadata-Loading Rebuild-Prevention Brick-Name Index
X1-DPG-1 1     LAB-XIO001 1     normal          28          97.809T          85.690T    65.344T           0                0                    False                      none               X1         1
X2-DPG-1 3     LAB-XIO001 1     double_degraded 26          97.809T          83.690T    65.359T           0                54                   False                      assigning_disk     X2         2

Resolution

MERK: Det er viktig å prioritere utskifting av SSD når de mislykkes. Når du bytter ut en SSD, må du vente til DPG er ferdig gjenoppbygd før du fortsetter med ytterligere utskiftninger.
 

Når to SSD-er i samme DPG mislykkes samtidig, kan ytelsen påvirkes på grunn av ressursene som forbrukes til å gjenoppbygge paritet. Det er ingen måte å stoppe DPG-gjenoppbyggingen, og det er heller ikke en kommando for å akselerere den. Men hvis kunden opplever betydelig ytelsesforringelse på grunn av dobbel degradert beskyttelsesmodus (rg_double_degrade), kan følgende handlinger bidra til om mulig å redusere virkningen:

  1. Sett alle sikkerhetskopieringer, replikasjoner eller intense I/O-jobber på pause til DPG-gjenoppbyggingen er fullført.
  2. Hvis det er mulig, mislykkes over de fleste aktive verter til annen lagring til DPG-gjenoppbyggingen er fullført.
  3. Hvis du bruker VM-er, må du slå av eller migrere virtuelle maskiner eller sette verter i vedlikeholdsmodus.
  4. Hvis det er mulig, bør du bruke QoS eller vertsbegrensning for å redusere belastningen på arrayet under gjenoppbygging.

Når DPG-gjenoppbyggingen er fullført, skal eventuelle relaterte ytelsespåvirkninger løses.

Additional Information

Affected Products

XtremIO, XtremIO X2
Article Properties
Article Number: 000355127
Article Type: Solution
Last Modified: 18 Sept 2025
Version:  3
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.