XtremIO: Auswirkungen von SSD-Ausfällen auf die Performance des XtremIO-Arrays

Summary: Auswirkungen von SSD-Ausfällen auf die Performance des XtremIO-Arrays

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Ein oder mehrere SSD-Ausfälle in XtremIO DPG können Auswirkungen auf die Performance des XtremIO-Arrays haben. Um zu verstehen, was diese Situation verursacht, müssen wir DPG-Operationen und DPG-Zustände erklären:

- Haupt-DPG-Operationen:

DPG-Neuaufbau:

  • Wann: Wenn eine SSD ausfällt
  • Warum: Schutz für doppelte Parität wiederherstellen

DPG-Integration:

  • Wann: Wenn ein Techniker ein fehlerhaftes SSD durch ein neues Laufwerk ersetzt
  • Warum: Hinzufügen einer neuen SSD zur DPG

DPG-Status:

  • Healthy: Schutz doppelter Parität
  • Einfach heruntergestuft: Schutz durch Einzelparität
  • Doppelt herabgesetzt: Kein Paritätsschutz
  • Fehlgeschlagen: Datenverlust

XtremIO ist ein Content Aware Storage (auch bekannt als CAS). Daher sind alle I/O-Vorgänge zum DPG statistisch zufällig. Diese Tatsache ermöglicht es uns, unabhängig von der zufälligen oder sequenziellen Workload des Nutzers die gleiche Leistung zu erzielen. Ein weiterer Vorteil besteht darin, dass das Cluster bei einem SSD-Ausfall eine Seite nicht an ihren ursprünglichen Speicherort zurückversetzen muss.

Andere Arrays, bei denen es sich nicht um CAS handelt, haben Anforderungen sowohl für sequenzielle logische Daten als auch für sequenzielle physische Daten. Wenn Sie die Daten nicht an ihren ursprünglichen Speicherort zurückgeben, geht die sequenzielle I/O-Leistung verloren.

Hinweis: Derselbe SSD-Speicherplatz, der für Nutzerschreibvorgänge verwendet wird, wird auch für die Datenwiederherstellung verwendet. Der Hot-Spare von XtremIO ist eigentlich horizontal.

DPG Rebuild erklärt:
Wenn eine SSD entfernt wird oder ausfällt, gibt SYM eine automatische DPG-Neuerstellung aus, für die DPG-Neuerstellung müssen zwei Vorgänge durchgeführt werden:

Phase 1: Stellen Sie alle verlorenen Daten wieder her und schreiben Sie sie an einen anderen Ort:
Die verlorenen Seiten (Daten + Parität) werden in der DPG wiederhergestellt (neuer Schreibfluss)
Die PLBM/HMD-Tabellen werden aktualisiert.

Phase 2: Aktualisieren Sie die Paritätsinformationen aller Stripes:
Das Verschieben von Daten-/Paritätsseiten erfordert die Aktualisierung aller Paritäten (über alle Stripes hinweg)Beide
Vorgänge erfordern die Aktualisierung aller Stripes, um Zeit zu sparen und Schreibvorgänge zu reduzieren. Beide werden in einer einzigen Iteration durchgeführt.

Hinweis: Der DPG-Wiederherstellungsablauf erfordert das Ausschlachten von Nutzerspeicherplatz. Die XtremIO-Implementierung hält jedoch eine SSD als Speicherplatz für die Wiederherstellung nach dem ersten Ausfall frei. Das ist die Anforderung pro X-Brick!
Hinweis: Wenn die DPG die erste SSD verliert. Die nutzbare Kapazität der DPG sinkt nicht. Wir stellen im Voraus Speicherplatz für ein solches Szenario zur Verfügung.
Hinweis: Wenn die DPG die zweite SSD verliert. Die nutzbare Kapazität der DPG sinkt um die Kapazität einer SSD.

DPG-Integration erklärt: Das Hinzufügen einer neuen SSD zur DPG erfordert einen manuellen Eingriff.

  • Dies erfordert den manuellen Eingriff eines/einer TechnikerIn (Einsetzen einer neuen SSD in den DAE-Steckplatz)
  • Es gibt wenig/keine Kritikalität (im Gegensatz zu einem erneuten Aufbau)

Nach der Anforderung gleicht der DPG-Integrationsprozess die Paritätsblöcke aus. Nur Paritätsblöcke werden auf der ursprünglichen SSD wiederhergestellt (um eine gleichmäßige Paritätsverteilung zu erreichen). Dies geschieht durch Zuweisen, Hinzufügen und Integrieren der neuen SSD.

 

Cause

Ausfälle einer oder mehrerer SSDs in XtremIO DPG

 

Resolution

Basierend auf den obigen Informationen kommt es während einer DPG-Neuerstellung/-Integration zu einem gewissen Anstieg der Auslastung der Clusterressourcen, obwohl in der Regel keine spürbare Erhöhung der Performance oder Latenz auftreten sollte. Während einer doppelten DPG-Neuerstellung konzentriert der Cluster jedoch fast alle Ressourcen darauf, die ausgefallenen SSDs so bald wie möglich wiederherzustellen, um die Datenintegrität zu gewährleisten und Datenverlust zu vermeiden. Dies ist vom Design her erwartet und die Leistung sollte nach Abschluss aller Vorgänge wieder normal sein.

 

Affected Products

XtremIO Family

Products

XtremIO Family
Article Properties
Article Number: 000071340
Article Type: Solution
Last Modified: 09 Jan 2026
Version:  5
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.