XtremIO: DPG har to samtidige SSD-feil som forårsaker ytelsespåvirkning
Summary: Denne artikkelen inneholder informasjon om hvordan XtremIO håndterer to tilfeller av feil på SSD (Solid State Drive) samtidig i en Data Protection Group (DPG), og forklarer hvordan det kan påvirke ytelsen. Den gir også noen anbefalinger om hvordan man kan bidra til å redusere ytelsespåvirkningen mens DPG gjenoppbygges. ...
Symptoms
En ytelsespåvirkning oppstår når en annen SSD svikter før DPG fullfører en gjenoppbygging fra en tidligere SSD-feil.
Cause
Hvis en SSD svikter på en XtremIO, gjenoppbygger DPG på de gjenværende fungerende SSD-ene for å opprettholde databeskyttelsen. DPG-gjenoppbyggingsprosessen er forskjellig for enkelt SSD-feil enn for to samtidige SSD-feil.
Når bare én SSD svikter:
- Systemet går inn i én enkelt degradert tilstand, og har bare én paritetsblokk for å gjenopprette dataene.
- DPG-gjenoppbygging starter gjenoppbyggingen av dataene fra den defekte SSD-en på de gjenværende sunne SSD-ene for å gå tilbake til en dobbel paritetsblokkstatus for databeskyttelse.
- Når DPG gjenoppbygges fra en enkelt SSD-feil, utføres gjenoppbyggingsprosessen i bakgrunnen, og innkommende I/O prioriteres fortsatt.
Når to samtidige SSD-feil i samme DPG:
- Systemet går inn i en dobbel degradert tilstand, noe som betyr at ingen paritetsbeskyttelse forblir.
- Risikoen for tap av data øker dramatisk, så systemet prioriterer gjenoppretting. Dette bruker flere CPUer for å gjenoppbygge DPG raskere.
- XtremIO prioriterer gjenoppbyggingsoperasjoner over bruker-I/O, og forbruker CPU- og minneressursene for å unngå tap av data.
- Denne typen gjenoppbygging krever massive metadataoppdateringer. Den må beregne paritet for hver berørte stripe og utfører kontroller av dataintegritet for å sikre at det ikke forekommer skade.
Varsler som kan vises når DPG gjenoppbygges:
| Varselsnavn | Symptomkode | Beskrivelse |
|---|---|---|
rebuild_0_to_20_done |
XTR0800211 |
Gjenoppbyggingen av DPG har startet. |
rebuild_20_to_40_done |
XTR0800221 |
DPG-gjenoppbygging pågår. Mer enn 20 prosent av gjenoppbyggingen er fullført. |
rebuild_40_to_60_done |
XTR0800231 |
DPG-gjenoppbygging pågår. Mer enn 40 prosent av gjenoppbyggingen er fullført. |
rebuild_60_to_80_done |
XTR0800241 |
DPG-gjenoppbygging pågår. Mer enn 60 prosent av gjenoppbyggingen er fullført. |
rebuild_99_done |
XTR0800251 |
DPG-gjenoppbygging pågår. Mer enn 80 prosent av gjenoppbyggingen er fullført. |
rg_state_integrate |
XTR0800904 |
DPG utfører SSD-integrering. |
ssd_assigning_to_rg |
XTR0900106 |
SSD tilordnes DPG. |
CLI-kommandoen show-data-protection-groups kan også kjøres for å kontrollere fremdriften til en DPG-gjenoppbygging:
xmcli (tech)> show-data-protection-groups Name Index Cluster-Name Index State Num-Of-SSDs Useful-SSD-Space User-Space User-Space-In-Use Rebuild-Progress Preparation-Progress Proactive-Metadata-Loading Rebuild-Prevention Brick-Name Index X1-DPG-1 1 LAB-XIO001 1 normal 28 97.809T 85.690T 65.344T 0 0 False none X1 1 X2-DPG-1 3 LAB-XIO001 1 double_degraded 26 97.809T 83.690T 65.359T 0 54 False assigning_disk X2 2
Resolution
Når to SSD-er i samme DPG mislykkes samtidig, kan ytelsen påvirkes på grunn av ressursene som forbrukes til å gjenoppbygge paritet. Det er ingen måte å stoppe DPG-gjenoppbyggingen, og det er heller ikke en kommando for å akselerere den. Men hvis kunden opplever betydelig ytelsesforringelse på grunn av dobbel degradert beskyttelsesmodus (rg_double_degrade), kan følgende handlinger bidra til om mulig å redusere virkningen:
- Sett alle sikkerhetskopieringer, replikasjoner eller intense I/O-jobber på pause til DPG-gjenoppbyggingen er fullført.
- Hvis det er mulig, mislykkes over de fleste aktive verter til annen lagring til DPG-gjenoppbyggingen er fullført.
- Hvis du bruker VM-er, må du slå av eller migrere virtuelle maskiner eller sette verter i vedlikeholdsmodus.
- Hvis det er mulig, bør du bruke QoS eller vertsbegrensning for å redusere belastningen på arrayet under gjenoppbygging.
Når DPG-gjenoppbyggingen er fullført, skal eventuelle relaterte ytelsespåvirkninger løses.
Additional Information
Relaterte artikler:
(Logg på som registrert Dell-støttebruker kan være nødvendig for å lese disse artiklene.)