XtremIO: Impacto en el rendimiento de fallas de SSD en el arreglo XtremIO

Summary: Impacto en el rendimiento de fallas de SSD en el arreglo XtremIO

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Las fallas de SSD únicas o múltiples en XtremIO DPG pueden causar un impacto en el rendimiento del arreglo XtremIO. Para entender qué causa esta situación, debemos explicar las operaciones de DPG y los estados de DPG:

- Principales operaciones de DPG:

Reconstrucción de DPG:

  • Cuándo: Cuando falla una SSD
  • Por qué: Restauración de la protección de paridad doble

Integración de DPG:

  • Cuándo: Cuando un técnico reemplaza una SSD fallida por una unidad nueva
  • Por qué: Agrega una nueva SSD a la DPG

Estados de DPG:

  • Healthy: Protección de paridad doble
  • Degradado único: Protección de paridad única
  • Doble degradado: Sin protección de paridad
  • Falló: Pérdida de datos

XtremIO es un almacenamiento orientado al contenido (también conocido como CAS). Por lo tanto, todas las operaciones de I/O al DPG son estadísticamente aleatorias, este hecho nos permite lograr el mismo rendimiento independientemente de la carga de trabajo aleatoria o secuencial del usuario. Otro beneficio es que, si falla una SSD, el clúster no está obligado a devolver una página a su ubicación original.

Otros arreglos que no son CAS tienen requisitos tanto para los datos lógicos secuenciales como para los datos físicos secuenciales; Si no devuelve los datos a su ubicación original, perderá el rendimiento de I/O secuencial.

Nota: El mismo espacio SSD que se usa para las escrituras de usuario también se utiliza para la recuperación de datos. El hot spare de XtremIO es realmente horizontal.

Explicación de DPG Rebuild:
Cuando se elimina una SSD o falla, SYM emite una reconstrucción automática de DPG. La reconstrucción de DPG requiere que se lleven a cabo dos operaciones:

Fase 1: Recupere todos los datos perdidos y escríbalos en otro lugar:
Las páginas perdidas (datos + paridad) se recuperan en el DPG (nuevo flujo de escritura)
Se actualizan las tablas PLBM/HMD.

Fase 2: Actualizar la información de paridad de todas las fracciones:
La transferencia de páginas de datos/paridad requiere la actualización de todas las paridades (en todas las fracciones)
Ambas operaciones requieren la actualización de todas las secciones para ahorrar tiempo y reducir las escrituras. Ambos se realizan en una sola iteración.

Nota: El flujo de reconstrucción de DPG requiere canibalizar el espacio del usuario; sin embargo, la implementación de XtremIO mantiene un espacio de SSD aparte para la recuperación de la primera falla. ¡Este es el requisito por X-Brick!
Nota: Cuando el DPG pierde la primera SSD. La capacidad útil del DPG no disminuye. Preasignamos espacio para este tipo de escenario
Nota: Cuando el DPG pierde la segunda SSD. La capacidad útil del DPG disminuye en la capacidad de una SSD.

Integración de DPG explicada: La adición de una nueva SSD al DPG requiere una intervención manual.

  • Requiere la intervención manual de un técnico (colocar una nueva SSD en la ranura del DAE)
  • Hay poca o ninguna criticidad (opuesta a una reconstrucción)

Una vez solicitado, el proceso de integración de DPG equilibra los bloques de paridad. Solo los bloques de paridad se recuperan en la SSD original (para lograr una distribución de paridad uniforme). Esto se hace mediante la asignación, adición e integración de la nueva SSD.

 

Cause

Fallas de SSD únicas o múltiples en XtremIO DPG

 

Resolution

De acuerdo con la información anterior, durante una reconstrucción/integración de DPG hay un aumento en la utilización de recursos del clúster, aunque, por lo general, no debería haber un aumento notable en el rendimiento o la latencia. Sin embargo, durante una reconstrucción doble de DPG , el clúster centra casi todos sus recursos en reconstruir las SSD fallidas lo antes posible a fin de garantizar la integridad de los datos y evitar la pérdida de datos. Esto es lo previsto por diseño, y el rendimiento debe volver al rendimiento normal después de la finalización de todas las operaciones.

 

Affected Products

XtremIO Family

Products

XtremIO Family
Article Properties
Article Number: 000071340
Article Type: Solution
Last Modified: 09 Jan 2026
Version:  5
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.