XtremIO: Impatto sulle prestazioni di un guasto dell'unità SSD sull'array XtremIO
Summary: Impatto sulle prestazioni di un guasto dell'unità SSD sull'array XtremIO
Symptoms
Guasti di una o più unità SSD in XtremIO DPG possono influire sulle prestazioni di XtremIO Array. Al fine di capire cosa causa questa situazione, dobbiamo spiegare le operazioni DPG e gli stati DPG:
- Principali operazioni DPG:
Ricostruzione DPG:
- Quando: Quando un unità SSD si guasta
- Perché: Ripristino della protezione della doppia parità
Integrazione DPG:
- Quando: Quando un tecnico sostituisce un'unità SSD guasta con un'unità nuova di zecca
- Perché: Aggiunge una nuova unità SSD al DPG
Stati DPG:
- Healthy: Protezione a doppia parità
- Danneggiato singolo: Protezione di parità singola
- Doppia Degradazione: Nessuna protezione di parità
- Operazione non riuscita: Perdita di dati
XtremIO è uno storage con riconoscimento dei contenuti (noto anche come CAS). Pertanto, tutte le operazioni di I/O sul DPG sono statisticamente casuali, questo fatto ci consente di ottenere le stesse prestazioni indipendentemente dal carico di lavoro casuale o sequenziale dell'utente. Un altro vantaggio è che, in caso di guasto di un'unità SSD, il cluster non è necessario per riportare una pagina alla posizione originale.
Altri array che non sono CAS hanno requisiti sia per i dati logici sequenziali che per i dati fisici sequenziali; Se i dati non vengono riportati nella posizione originale, le prestazioni di I/O sequenziali vengono perse.
Spiegazione della ricostruzione DPG:
Quando un'unità SSD viene rimossa o si guasta, SYM emette una ricostruzione DPG automatica, che richiede due operazioni:
Fase 1. Recupera tutti i dati persi e scrivili altrove:
Le pagine perse (dati + parità) vengono ripristinate nel DPG (nuovo flusso di scrittura)
Le tabelle PLBM/HMD vengono aggiornate.
Fase 2. Aggiornare le informazioni di parità di tutti gli stripe:
lo spostamento delle pagine di dati/parità richiede l'aggiornamento di tutte le parità (su tutti gli stripe)
Entrambe le operazioni richiedono l'aggiornamento di tutti gli stripe, per risparmiare tempo e ridurre le scritture. Entrambi vengono eseguiti su una singola iterazione.
Spiegazione dell'integrazione DPG: L'aggiunta di una nuova unità SSD al DPG richiede un intervento manuale.
- Richiede l'intervento manuale di un tecnico (posizionare una nuova unità SSD nello slot DAE)
- La criticità è scarsa o assente (al contrario di una ricostruzione)
Una volta richiesto, il processo di integrazione DPG bilancia i blocchi di parità. Solo i blocchi di parità vengono ripristinati sull'SSD originale (per ottenere una distribuzione uniforme della parità). Questo viene fatto assegnando, aggiungendo e integrando il nuovo SSD.
Cause
Guasti a SSD singolo o multiplo in XtremIO DPG
Resolution
Sulla base delle informazioni di cui sopra, durante una ricostruzione/integrazione DPG si verifica un certo aumento nell'utilizzo delle risorse del cluster, anche se in genere non dovrebbe esserci un aumento evidente delle prestazioni o della latenza. Tuttavia, durante una doppia ricostruzione DPG , il cluster concentra quasi tutte le sue risorse sulla ricostruzione delle unità SSD guaste il prima possibile al fine di garantire l'integrità dei dati ed evitare la perdita di dati. Ciò è previsto per progettazione e le prestazioni dovrebbero tornare alle normali prestazioni al termine di tutte le operazioni.