XtremIO: DPG presenta due guasti simultanei dell'unità SSD che causano un impatto sulle prestazioni

Summary: Questo articolo fornisce informazioni sul modo in cui XtremIO gestisce due guasti simultanei delle unità SSD (SSD (SSD in un Data Protection Group) e spiega in che modo può influire sulle prestazioni. Offre inoltre alcuni consigli su come ridurre l'impatto sulle prestazioni durante la ricostruzione del DPG. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Un impatto sulle prestazioni si verifica quando una seconda unità SSD si guasta prima che il DPG completi una ricostruzione da un precedente guasto dell'unità SSD.

Cause

In un XtremIO, se una SSD si guasta, il DPG si ricostruisce sulle SSD integre rimanenti per mantenere la protezione dei dati. Il processo di ricostruzione del DPG è diverso per gli errori di una singola unità SSD rispetto a quello di due unità SSD simultanee.

In caso di guasto di una sola SSD:

  • Il sistema entra in un singolo stato danneggiato e dispone di un solo blocco di parità per ripristinare i dati.
  • La ricostruzione DPG inizia a ricostruire i dati dall SSD guasto sulle SSD integre rimanenti per tornare a uno stato di blocco di parità doppia per la protezione dei dati.
  • Quando DPG esegue la ricostruzione da un singolo guasto dell'unità SSD, il processo di ricostruzione viene eseguito in background e l'I/O in ingresso continua ad avere la priorità.

Quando si verificano due guasti simultanei dell'unità SSD nello stesso DPG:

  • Il sistema entra in un doppio stato danneggiato, il che significa che non rimane alcuna protezione di parità.
  • Il rischio di perdita dei dati aumenta notevolmente, quindi il sistema dà priorità al ripristino. In questo modo vengono utilizzate più CPU per ricostruire il DPG più velocemente.
  • XtremIO assegna la priorità alle operazioni di ricostruzione rispetto all'I/O dell'utente, consumando le risorse di CPU e memoria per evitare la perdita di dati.
  • Questo tipo di ricostruzione richiede massicci aggiornamenti dei metadati. Deve calcolare la parità per ogni stripe interessato ed eseguire controlli di integrità dei dati per garantire che non vi sia alcun danneggiamento.

Avvisi che possono essere visualizzati durante la ricostruzione del DPG:

Alert Name Codice sintomo Descrizione
rebuild_0_to_20_done XTR0800211 La ricostruzione DPG è iniziata.
rebuild_20_to_40_done XTR0800221 La ricostruzione DPG è in corso. Oltre il 20% della ricostruzione è stata completata.
rebuild_40_to_60_done XTR0800231 La ricostruzione DPG è in corso. Oltre il 40% della ricostruzione è stata completata.
rebuild_60_to_80_done XTR0800241 La ricostruzione DPG è in corso. Oltre il 60% della ricostruzione è stata completata.
rebuild_99_done XTR0800251 La ricostruzione DPG è in corso. Oltre l'80% della ricostruzione è stata completata.
rg_state_integrate XTR0800904 Il DPG sta eseguendo l'integrazione SSD.
ssd_assigning_to_rg XTR0900106 L'SSD è in fase di assegnazione al DPG.


Il comando CLI show-data-protection-groups può anche essere eseguito per controllare l'avanzamento di una ricostruzione DPG:

xmcli (tech)> show-data-protection-groups
Name     Index Cluster-Name   Index State           Num-Of-SSDs Useful-SSD-Space User-Space User-Space-In-Use Rebuild-Progress Preparation-Progress Proactive-Metadata-Loading Rebuild-Prevention Brick-Name Index
X1-DPG-1 1     LAB-XIO001 1     normal          28          97.809T          85.690T    65.344T           0                0                    False                      none               X1         1
X2-DPG-1 3     LAB-XIO001 1     double_degraded 26          97.809T          83.690T    65.359T           0                54                   False                      assigning_disk     X2         2

Resolution

NOTA: È importante assegnare la priorità alla sostituzione delle unità SSD in caso di guasto. Quando si sostituisce un'unità SSD, attendere che il DPG completi la ricostruzione prima di procedere con eventuali sostituzioni aggiuntive.
 

Quando due SSD all'interno dello stesso DPG si guastano contemporaneamente, le prestazioni possono essere influenzate dalle risorse utilizzate per ricostruire la parità. Non è possibile arrestare la ricostruzione del DPG, né è disponibile un comando per accelerarla. Tuttavia, se il cliente riscontra un significativo peggioramento delle prestazioni a causa della modalità di protezione con doppia protezione degradata (rg_double_degrade), le seguenti azioni possono contribuire a ridurre l'impatto, se possibile:

  1. Sospendere eventuali processi di backup, replica o I/O intensi fino al completamento della ricostruzione DPG.
  2. Se possibile, eseguire il failover della maggior parte degli host attivi su un altro storage fino al completamento della ricostruzione DPG.
  3. Se si utilizzano macchine virtuali, spegnerle o migrarle o impostare gli host in modalità di manutenzione.
  4. Se possibile, utilizzare QoS o la limitazione lato host per ridurre il carico sull'array durante la ricostruzione.

Una volta completata la ricostruzione DPG, qualsiasi impatto sulle prestazioni correlato dovrebbe risolversi.

Additional Information

Articoli correlati:
(per visualizzare questi articoli potrebbe essere necessario eseguire l'accesso come utente registrato del supporto Dell).

Affected Products

XtremIO, XtremIO X2
Article Properties
Article Number: 000355127
Article Type: Solution
Last Modified: 18 Sept 2025
Version:  3
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.