XtremIO: Impatto sulle prestazioni di un guasto dell'unità SSD sull'array XtremIO

Summary: Impatto sulle prestazioni di un guasto dell'unità SSD sull'array XtremIO

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Guasti di una o più unità SSD in XtremIO DPG possono influire sulle prestazioni di XtremIO Array. Al fine di capire cosa causa questa situazione, dobbiamo spiegare le operazioni DPG e gli stati DPG:

- Principali operazioni DPG:

Ricostruzione DPG:

  • Quando: Quando un unità SSD si guasta
  • Perché: Ripristino della protezione della doppia parità

Integrazione DPG:

  • Quando: Quando un tecnico sostituisce un'unità SSD guasta con un'unità nuova di zecca
  • Perché: Aggiunge una nuova unità SSD al DPG

Stati DPG:

  • Healthy: Protezione a doppia parità
  • Danneggiato singolo: Protezione di parità singola
  • Doppia Degradazione: Nessuna protezione di parità
  • Operazione non riuscita: Perdita di dati

XtremIO è uno storage con riconoscimento dei contenuti (noto anche come CAS). Pertanto, tutte le operazioni di I/O sul DPG sono statisticamente casuali, questo fatto ci consente di ottenere le stesse prestazioni indipendentemente dal carico di lavoro casuale o sequenziale dell'utente. Un altro vantaggio è che, in caso di guasto di un'unità SSD, il cluster non è necessario per riportare una pagina alla posizione originale.

Altri array che non sono CAS hanno requisiti sia per i dati logici sequenziali che per i dati fisici sequenziali; Se i dati non vengono riportati nella posizione originale, le prestazioni di I/O sequenziali vengono perse.

Nota: Lo stesso spazio SSD utilizzato per le scritture dell'utente viene utilizzato anche per il ripristino dei dati. L'hot-spare di XtremIO è in realtà orizzontale.

Spiegazione della ricostruzione DPG:
Quando un'unità SSD viene rimossa o si guasta, SYM emette una ricostruzione DPG automatica, che richiede due operazioni:

Fase 1. Recupera tutti i dati persi e scrivili altrove:
Le pagine perse (dati + parità) vengono ripristinate nel DPG (nuovo flusso di scrittura)
Le tabelle PLBM/HMD vengono aggiornate.

Fase 2. Aggiornare le informazioni di parità di tutti gli stripe:
lo spostamento delle pagine di dati/parità richiede l'aggiornamento di tutte le parità (su tutti gli stripe)
Entrambe le operazioni richiedono l'aggiornamento di tutti gli stripe, per risparmiare tempo e ridurre le scritture. Entrambi vengono eseguiti su una singola iterazione.

Nota: Il flusso di ricostruzione DPG richiede la cannibalizzazione dello spazio utente, tuttavia l'implementazione XtremIO mette da parte uno spazio del valore di un SSD per il ripristino dal primo guasto. Questo è il requisito per X-Brick!
Nota: Quando il DPG perde la prima SSD. La capacità utilizzabile del DPG non diminuisce. Pre-assegniamo lo spazio per uno scenario di questo tipo
Nota: Quando il DPG perde la seconda SSD. La capacità utilizzabile del DPG diminuisce della capacità di una SSD.

Spiegazione dell'integrazione DPG: L'aggiunta di una nuova unità SSD al DPG richiede un intervento manuale.

  • Richiede l'intervento manuale di un tecnico (posizionare una nuova unità SSD nello slot DAE)
  • La criticità è scarsa o assente (al contrario di una ricostruzione)

Una volta richiesto, il processo di integrazione DPG bilancia i blocchi di parità. Solo i blocchi di parità vengono ripristinati sull'SSD originale (per ottenere una distribuzione uniforme della parità). Questo viene fatto assegnando, aggiungendo e integrando il nuovo SSD.

 

Cause

Guasti a SSD singolo o multiplo in XtremIO DPG

 

Resolution

Sulla base delle informazioni di cui sopra, durante una ricostruzione/integrazione DPG si verifica un certo aumento nell'utilizzo delle risorse del cluster, anche se in genere non dovrebbe esserci un aumento evidente delle prestazioni o della latenza. Tuttavia, durante una doppia ricostruzione DPG , il cluster concentra quasi tutte le sue risorse sulla ricostruzione delle unità SSD guaste il prima possibile al fine di garantire l'integrità dei dati ed evitare la perdita di dati. Ciò è previsto per progettazione e le prestazioni dovrebbero tornare alle normali prestazioni al termine di tutte le operazioni.

 

Affected Products

XtremIO Family

Products

XtremIO Family
Article Properties
Article Number: 000071340
Article Type: Solution
Last Modified: 09 Jan 2026
Version:  5
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.