XtremIO: Impacto en el rendimiento de fallas de SSD en el arreglo XtremIO
Summary: Impacto en el rendimiento de fallas de SSD en el arreglo XtremIO
Symptoms
Las fallas de SSD únicas o múltiples en XtremIO DPG pueden causar un impacto en el rendimiento del arreglo XtremIO. Para entender qué causa esta situación, debemos explicar las operaciones de DPG y los estados de DPG:
- Principales operaciones de DPG:
Reconstrucción de DPG:
- Cuándo: Cuando falla una SSD
- Por qué: Restauración de la protección de paridad doble
Integración de DPG:
- Cuándo: Cuando un técnico reemplaza una SSD fallida por una unidad nueva
- Por qué: Agrega una nueva SSD a la DPG
Estados de DPG:
- Healthy: Protección de paridad doble
- Degradado único: Protección de paridad única
- Doble degradado: Sin protección de paridad
- Falló: Pérdida de datos
XtremIO es un almacenamiento orientado al contenido (también conocido como CAS). Por lo tanto, todas las operaciones de I/O al DPG son estadísticamente aleatorias, este hecho nos permite lograr el mismo rendimiento independientemente de la carga de trabajo aleatoria o secuencial del usuario. Otro beneficio es que, si falla una SSD, el clúster no está obligado a devolver una página a su ubicación original.
Otros arreglos que no son CAS tienen requisitos tanto para los datos lógicos secuenciales como para los datos físicos secuenciales; Si no devuelve los datos a su ubicación original, perderá el rendimiento de I/O secuencial.
Explicación de DPG Rebuild:
Cuando se elimina una SSD o falla, SYM emite una reconstrucción automática de DPG. La reconstrucción de DPG requiere que se lleven a cabo dos operaciones:
Fase 1: Recupere todos los datos perdidos y escríbalos en otro lugar:
Las páginas perdidas (datos + paridad) se recuperan en el DPG (nuevo flujo de escritura)
Se actualizan las tablas PLBM/HMD.
Fase 2: Actualizar la información de paridad de todas las fracciones:
La transferencia de páginas de datos/paridad requiere la actualización de todas las paridades (en todas las fracciones)
Ambas operaciones requieren la actualización de todas las secciones para ahorrar tiempo y reducir las escrituras. Ambos se realizan en una sola iteración.
Integración de DPG explicada: La adición de una nueva SSD al DPG requiere una intervención manual.
- Requiere la intervención manual de un técnico (colocar una nueva SSD en la ranura del DAE)
- Hay poca o ninguna criticidad (opuesta a una reconstrucción)
Una vez solicitado, el proceso de integración de DPG equilibra los bloques de paridad. Solo los bloques de paridad se recuperan en la SSD original (para lograr una distribución de paridad uniforme). Esto se hace mediante la asignación, adición e integración de la nueva SSD.
Cause
Fallas de SSD únicas o múltiples en XtremIO DPG
Resolution
De acuerdo con la información anterior, durante una reconstrucción/integración de DPG hay un aumento en la utilización de recursos del clúster, aunque, por lo general, no debería haber un aumento notable en el rendimiento o la latencia. Sin embargo, durante una reconstrucción doble de DPG , el clúster centra casi todos sus recursos en reconstruir las SSD fallidas lo antes posible a fin de garantizar la integridad de los datos y evitar la pérdida de datos. Esto es lo previsto por diseño, y el rendimiento debe volver al rendimiento normal después de la finalización de todas las operaciones.