XtremIO: DPG presenta due guasti simultanei dell'unità SSD che causano un impatto sulle prestazioni

Zhrnutie: Questo articolo fornisce informazioni sul modo in cui XtremIO gestisce due guasti simultanei delle unità SSD (SSD (SSD in un Data Protection Group) e spiega in che modo può influire sulle prestazioni. Offre inoltre alcuni consigli su come ridurre l'impatto sulle prestazioni durante la ricostruzione del DPG. ...

Tento článok sa vzťahuje na Tento článok sa nevzťahuje na Tento článok nie je viazaný na žiadny konkrétny produkt. V tomto článku nie sú uvedené všetky verzie produktov.

Symptómy

Un impatto sulle prestazioni si verifica quando una seconda unità SSD si guasta prima che il DPG completi una ricostruzione da un precedente guasto dell'unità SSD.

Príčina

In un XtremIO, se una SSD si guasta, il DPG si ricostruisce sulle SSD integre rimanenti per mantenere la protezione dei dati. Il processo di ricostruzione del DPG è diverso per gli errori di una singola unità SSD rispetto a quello di due unità SSD simultanee.

In caso di guasto di una sola SSD:

  • Il sistema entra in un singolo stato danneggiato e dispone di un solo blocco di parità per ripristinare i dati.
  • La ricostruzione DPG inizia a ricostruire i dati dall SSD guasto sulle SSD integre rimanenti per tornare a uno stato di blocco di parità doppia per la protezione dei dati.
  • Quando DPG esegue la ricostruzione da un singolo guasto dell'unità SSD, il processo di ricostruzione viene eseguito in background e l'I/O in ingresso continua ad avere la priorità.

Quando si verificano due guasti simultanei dell'unità SSD nello stesso DPG:

  • Il sistema entra in un doppio stato danneggiato, il che significa che non rimane alcuna protezione di parità.
  • Il rischio di perdita dei dati aumenta notevolmente, quindi il sistema dà priorità al ripristino. In questo modo vengono utilizzate più CPU per ricostruire il DPG più velocemente.
  • XtremIO assegna la priorità alle operazioni di ricostruzione rispetto all'I/O dell'utente, consumando le risorse di CPU e memoria per evitare la perdita di dati.
  • Questo tipo di ricostruzione richiede massicci aggiornamenti dei metadati. Deve calcolare la parità per ogni stripe interessato ed eseguire controlli di integrità dei dati per garantire che non vi sia alcun danneggiamento.

Avvisi che possono essere visualizzati durante la ricostruzione del DPG:

Alert Name Codice sintomo Descrizione
rebuild_0_to_20_done XTR0800211 La ricostruzione DPG è iniziata.
rebuild_20_to_40_done XTR0800221 La ricostruzione DPG è in corso. Oltre il 20% della ricostruzione è stata completata.
rebuild_40_to_60_done XTR0800231 La ricostruzione DPG è in corso. Oltre il 40% della ricostruzione è stata completata.
rebuild_60_to_80_done XTR0800241 La ricostruzione DPG è in corso. Oltre il 60% della ricostruzione è stata completata.
rebuild_99_done XTR0800251 La ricostruzione DPG è in corso. Oltre l'80% della ricostruzione è stata completata.
rg_state_integrate XTR0800904 Il DPG sta eseguendo l'integrazione SSD.
ssd_assigning_to_rg XTR0900106 L'SSD è in fase di assegnazione al DPG.


Il comando CLI show-data-protection-groups può anche essere eseguito per controllare l'avanzamento di una ricostruzione DPG:

xmcli (tech)> show-data-protection-groups
Name     Index Cluster-Name   Index State           Num-Of-SSDs Useful-SSD-Space User-Space User-Space-In-Use Rebuild-Progress Preparation-Progress Proactive-Metadata-Loading Rebuild-Prevention Brick-Name Index
X1-DPG-1 1     LAB-XIO001 1     normal          28          97.809T          85.690T    65.344T           0                0                    False                      none               X1         1
X2-DPG-1 3     LAB-XIO001 1     double_degraded 26          97.809T          83.690T    65.359T           0                54                   False                      assigning_disk     X2         2

Riešenie

NOTA: È importante assegnare la priorità alla sostituzione delle unità SSD in caso di guasto. Quando si sostituisce un'unità SSD, attendere che il DPG completi la ricostruzione prima di procedere con eventuali sostituzioni aggiuntive.
 

Quando due SSD all'interno dello stesso DPG si guastano contemporaneamente, le prestazioni possono essere influenzate dalle risorse utilizzate per ricostruire la parità. Non è possibile arrestare la ricostruzione del DPG, né è disponibile un comando per accelerarla. Tuttavia, se il cliente riscontra un significativo peggioramento delle prestazioni a causa della modalità di protezione con doppia protezione degradata (rg_double_degrade), le seguenti azioni possono contribuire a ridurre l'impatto, se possibile:

  1. Sospendere eventuali processi di backup, replica o I/O intensi fino al completamento della ricostruzione DPG.
  2. Se possibile, eseguire il failover della maggior parte degli host attivi su un altro storage fino al completamento della ricostruzione DPG.
  3. Se si utilizzano macchine virtuali, spegnerle o migrarle o impostare gli host in modalità di manutenzione.
  4. Se possibile, utilizzare QoS o la limitazione lato host per ridurre il carico sull'array durante la ricostruzione.

Una volta completata la ricostruzione DPG, qualsiasi impatto sulle prestazioni correlato dovrebbe risolversi.

Ďalšie informácie

Articoli correlati:
(per visualizzare questi articoli potrebbe essere necessario eseguire l'accesso come utente registrato del supporto Dell).

Dotknuté produkty

XtremIO, XtremIO X2
Vlastnosti článku
Číslo článku: 000355127
Typ článku: Solution
Dátum poslednej úpravy: 18 sep 2025
Verzia:  3
Nájdite odpovede na svoje otázky od ostatných používateľov spoločnosti Dell
Služby podpory
Skontrolujte, či sa na vaše zariadenie vzťahujú služby podpory.