XtremIO: DPG har to samtidige SSD-feil som forårsaker ytelsespåvirkning

Zhrnutie: Denne artikkelen inneholder informasjon om hvordan XtremIO håndterer to tilfeller av feil på SSD (Solid State Drive) samtidig i en Data Protection Group (DPG), og forklarer hvordan det kan påvirke ytelsen. Den gir også noen anbefalinger om hvordan man kan bidra til å redusere ytelsespåvirkningen mens DPG gjenoppbygges. ...

Tento článok sa vzťahuje na Tento článok sa nevzťahuje na Tento článok nie je viazaný na žiadny konkrétny produkt. V tomto článku nie sú uvedené všetky verzie produktov.

Symptómy

En ytelsespåvirkning oppstår når en annen SSD svikter før DPG fullfører en gjenoppbygging fra en tidligere SSD-feil.

Príčina

Hvis en SSD svikter på en XtremIO, gjenoppbygger DPG på de gjenværende fungerende SSD-ene for å opprettholde databeskyttelsen. DPG-gjenoppbyggingsprosessen er forskjellig for enkelt SSD-feil enn for to samtidige SSD-feil.

Når bare én SSD svikter:

  • Systemet går inn i én enkelt degradert tilstand, og har bare én paritetsblokk for å gjenopprette dataene.
  • DPG-gjenoppbygging starter gjenoppbyggingen av dataene fra den defekte SSD-en på de gjenværende sunne SSD-ene for å gå tilbake til en dobbel paritetsblokkstatus for databeskyttelse.
  • Når DPG gjenoppbygges fra en enkelt SSD-feil, utføres gjenoppbyggingsprosessen i bakgrunnen, og innkommende I/O prioriteres fortsatt.

Når to samtidige SSD-feil i samme DPG:

  • Systemet går inn i en dobbel degradert tilstand, noe som betyr at ingen paritetsbeskyttelse forblir.
  • Risikoen for tap av data øker dramatisk, så systemet prioriterer gjenoppretting. Dette bruker flere CPUer for å gjenoppbygge DPG raskere.
  • XtremIO prioriterer gjenoppbyggingsoperasjoner over bruker-I/O, og forbruker CPU- og minneressursene for å unngå tap av data.
  • Denne typen gjenoppbygging krever massive metadataoppdateringer. Den må beregne paritet for hver berørte stripe og utfører kontroller av dataintegritet for å sikre at det ikke forekommer skade.

Varsler som kan vises når DPG gjenoppbygges:

Varselsnavn Symptomkode Beskrivelse
rebuild_0_to_20_done XTR0800211 Gjenoppbyggingen av DPG har startet.
rebuild_20_to_40_done XTR0800221 DPG-gjenoppbygging pågår. Mer enn 20 prosent av gjenoppbyggingen er fullført.
rebuild_40_to_60_done XTR0800231 DPG-gjenoppbygging pågår. Mer enn 40 prosent av gjenoppbyggingen er fullført.
rebuild_60_to_80_done XTR0800241 DPG-gjenoppbygging pågår. Mer enn 60 prosent av gjenoppbyggingen er fullført.
rebuild_99_done XTR0800251 DPG-gjenoppbygging pågår. Mer enn 80 prosent av gjenoppbyggingen er fullført.
rg_state_integrate XTR0800904 DPG utfører SSD-integrering.
ssd_assigning_to_rg XTR0900106 SSD tilordnes DPG.


CLI-kommandoen show-data-protection-groups kan også kjøres for å kontrollere fremdriften til en DPG-gjenoppbygging:

xmcli (tech)> show-data-protection-groups
Name     Index Cluster-Name   Index State           Num-Of-SSDs Useful-SSD-Space User-Space User-Space-In-Use Rebuild-Progress Preparation-Progress Proactive-Metadata-Loading Rebuild-Prevention Brick-Name Index
X1-DPG-1 1     LAB-XIO001 1     normal          28          97.809T          85.690T    65.344T           0                0                    False                      none               X1         1
X2-DPG-1 3     LAB-XIO001 1     double_degraded 26          97.809T          83.690T    65.359T           0                54                   False                      assigning_disk     X2         2

Riešenie

MERK: Det er viktig å prioritere utskifting av SSD når de mislykkes. Når du bytter ut en SSD, må du vente til DPG er ferdig gjenoppbygd før du fortsetter med ytterligere utskiftninger.
 

Når to SSD-er i samme DPG mislykkes samtidig, kan ytelsen påvirkes på grunn av ressursene som forbrukes til å gjenoppbygge paritet. Det er ingen måte å stoppe DPG-gjenoppbyggingen, og det er heller ikke en kommando for å akselerere den. Men hvis kunden opplever betydelig ytelsesforringelse på grunn av dobbel degradert beskyttelsesmodus (rg_double_degrade), kan følgende handlinger bidra til om mulig å redusere virkningen:

  1. Sett alle sikkerhetskopieringer, replikasjoner eller intense I/O-jobber på pause til DPG-gjenoppbyggingen er fullført.
  2. Hvis det er mulig, mislykkes over de fleste aktive verter til annen lagring til DPG-gjenoppbyggingen er fullført.
  3. Hvis du bruker VM-er, må du slå av eller migrere virtuelle maskiner eller sette verter i vedlikeholdsmodus.
  4. Hvis det er mulig, bør du bruke QoS eller vertsbegrensning for å redusere belastningen på arrayet under gjenoppbygging.

Når DPG-gjenoppbyggingen er fullført, skal eventuelle relaterte ytelsespåvirkninger løses.

Ďalšie informácie

Dotknuté produkty

XtremIO, XtremIO X2
Vlastnosti článku
Číslo článku: 000355127
Typ článku: Solution
Dátum poslednej úpravy: 18 sep 2025
Verzia:  3
Nájdite odpovede na svoje otázky od ostatných používateľov spoločnosti Dell
Služby podpory
Skontrolujte, či sa na vaše zariadenie vzťahujú služby podpory.