XtremIO: DPG presenta due guasti simultanei dell'unità SSD che causano un impatto sulle prestazioni
Summary: Questo articolo fornisce informazioni sul modo in cui XtremIO gestisce due guasti simultanei delle unità SSD (SSD (SSD in un Data Protection Group) e spiega in che modo può influire sulle prestazioni. Offre inoltre alcuni consigli su come ridurre l'impatto sulle prestazioni durante la ricostruzione del DPG. ...
Symptoms
Un impatto sulle prestazioni si verifica quando una seconda unità SSD si guasta prima che il DPG completi una ricostruzione da un precedente guasto dell'unità SSD.
Cause
In un XtremIO, se una SSD si guasta, il DPG si ricostruisce sulle SSD integre rimanenti per mantenere la protezione dei dati. Il processo di ricostruzione del DPG è diverso per gli errori di una singola unità SSD rispetto a quello di due unità SSD simultanee.
In caso di guasto di una sola SSD:
- Il sistema entra in un singolo stato danneggiato e dispone di un solo blocco di parità per ripristinare i dati.
- La ricostruzione DPG inizia a ricostruire i dati dall SSD guasto sulle SSD integre rimanenti per tornare a uno stato di blocco di parità doppia per la protezione dei dati.
- Quando DPG esegue la ricostruzione da un singolo guasto dell'unità SSD, il processo di ricostruzione viene eseguito in background e l'I/O in ingresso continua ad avere la priorità.
Quando si verificano due guasti simultanei dell'unità SSD nello stesso DPG:
- Il sistema entra in un doppio stato danneggiato, il che significa che non rimane alcuna protezione di parità.
- Il rischio di perdita dei dati aumenta notevolmente, quindi il sistema dà priorità al ripristino. In questo modo vengono utilizzate più CPU per ricostruire il DPG più velocemente.
- XtremIO assegna la priorità alle operazioni di ricostruzione rispetto all'I/O dell'utente, consumando le risorse di CPU e memoria per evitare la perdita di dati.
- Questo tipo di ricostruzione richiede massicci aggiornamenti dei metadati. Deve calcolare la parità per ogni stripe interessato ed eseguire controlli di integrità dei dati per garantire che non vi sia alcun danneggiamento.
Avvisi che possono essere visualizzati durante la ricostruzione del DPG:
| Alert Name | Codice sintomo | Descrizione |
|---|---|---|
rebuild_0_to_20_done |
XTR0800211 |
La ricostruzione DPG è iniziata. |
rebuild_20_to_40_done |
XTR0800221 |
La ricostruzione DPG è in corso. Oltre il 20% della ricostruzione è stata completata. |
rebuild_40_to_60_done |
XTR0800231 |
La ricostruzione DPG è in corso. Oltre il 40% della ricostruzione è stata completata. |
rebuild_60_to_80_done |
XTR0800241 |
La ricostruzione DPG è in corso. Oltre il 60% della ricostruzione è stata completata. |
rebuild_99_done |
XTR0800251 |
La ricostruzione DPG è in corso. Oltre l'80% della ricostruzione è stata completata. |
rg_state_integrate |
XTR0800904 |
Il DPG sta eseguendo l'integrazione SSD. |
ssd_assigning_to_rg |
XTR0900106 |
L'SSD è in fase di assegnazione al DPG. |
Il comando CLI show-data-protection-groups può anche essere eseguito per controllare l'avanzamento di una ricostruzione DPG:
xmcli (tech)> show-data-protection-groups Name Index Cluster-Name Index State Num-Of-SSDs Useful-SSD-Space User-Space User-Space-In-Use Rebuild-Progress Preparation-Progress Proactive-Metadata-Loading Rebuild-Prevention Brick-Name Index X1-DPG-1 1 LAB-XIO001 1 normal 28 97.809T 85.690T 65.344T 0 0 False none X1 1 X2-DPG-1 3 LAB-XIO001 1 double_degraded 26 97.809T 83.690T 65.359T 0 54 False assigning_disk X2 2
Resolution
Quando due SSD all'interno dello stesso DPG si guastano contemporaneamente, le prestazioni possono essere influenzate dalle risorse utilizzate per ricostruire la parità. Non è possibile arrestare la ricostruzione del DPG, né è disponibile un comando per accelerarla. Tuttavia, se il cliente riscontra un significativo peggioramento delle prestazioni a causa della modalità di protezione con doppia protezione degradata (rg_double_degrade), le seguenti azioni possono contribuire a ridurre l'impatto, se possibile:
- Sospendere eventuali processi di backup, replica o I/O intensi fino al completamento della ricostruzione DPG.
- Se possibile, eseguire il failover della maggior parte degli host attivi su un altro storage fino al completamento della ricostruzione DPG.
- Se si utilizzano macchine virtuali, spegnerle o migrarle o impostare gli host in modalità di manutenzione.
- Se possibile, utilizzare QoS o la limitazione lato host per ridurre il carico sull'array durante la ricostruzione.
Una volta completata la ricostruzione DPG, qualsiasi impatto sulle prestazioni correlato dovrebbe risolversi.
Additional Information
Articoli correlati:
(per visualizzare questi articoli potrebbe essere necessario eseguire l'accesso come utente registrato del supporto Dell).