XtremIO: Auswirkungen von SSD-Ausfällen auf die Performance des XtremIO-Arrays
Summary: Auswirkungen von SSD-Ausfällen auf die Performance des XtremIO-Arrays
Symptoms
Ein oder mehrere SSD-Ausfälle in XtremIO DPG können Auswirkungen auf die Performance des XtremIO-Arrays haben. Um zu verstehen, was diese Situation verursacht, müssen wir DPG-Operationen und DPG-Zustände erklären:
- Haupt-DPG-Operationen:
DPG-Neuaufbau:
- Wann: Wenn eine SSD ausfällt
- Warum: Schutz für doppelte Parität wiederherstellen
DPG-Integration:
- Wann: Wenn ein Techniker ein fehlerhaftes SSD durch ein neues Laufwerk ersetzt
- Warum: Hinzufügen einer neuen SSD zur DPG
DPG-Status:
- Healthy: Schutz doppelter Parität
- Einfach heruntergestuft: Schutz durch Einzelparität
- Doppelt herabgesetzt: Kein Paritätsschutz
- Fehlgeschlagen: Datenverlust
XtremIO ist ein Content Aware Storage (auch bekannt als CAS). Daher sind alle I/O-Vorgänge zum DPG statistisch zufällig. Diese Tatsache ermöglicht es uns, unabhängig von der zufälligen oder sequenziellen Workload des Nutzers die gleiche Leistung zu erzielen. Ein weiterer Vorteil besteht darin, dass das Cluster bei einem SSD-Ausfall eine Seite nicht an ihren ursprünglichen Speicherort zurückversetzen muss.
Andere Arrays, bei denen es sich nicht um CAS handelt, haben Anforderungen sowohl für sequenzielle logische Daten als auch für sequenzielle physische Daten. Wenn Sie die Daten nicht an ihren ursprünglichen Speicherort zurückgeben, geht die sequenzielle I/O-Leistung verloren.
DPG Rebuild erklärt:
Wenn eine SSD entfernt wird oder ausfällt, gibt SYM eine automatische DPG-Neuerstellung aus, für die DPG-Neuerstellung müssen zwei Vorgänge durchgeführt werden:
Phase 1: Stellen Sie alle verlorenen Daten wieder her und schreiben Sie sie an einen anderen Ort:
Die verlorenen Seiten (Daten + Parität) werden in der DPG wiederhergestellt (neuer Schreibfluss)
Die PLBM/HMD-Tabellen werden aktualisiert.
Phase 2: Aktualisieren Sie die Paritätsinformationen aller Stripes:
Das Verschieben von Daten-/Paritätsseiten erfordert die Aktualisierung aller Paritäten (über alle Stripes hinweg)Beide
Vorgänge erfordern die Aktualisierung aller Stripes, um Zeit zu sparen und Schreibvorgänge zu reduzieren. Beide werden in einer einzigen Iteration durchgeführt.
DPG-Integration erklärt: Das Hinzufügen einer neuen SSD zur DPG erfordert einen manuellen Eingriff.
- Dies erfordert den manuellen Eingriff eines/einer TechnikerIn (Einsetzen einer neuen SSD in den DAE-Steckplatz)
- Es gibt wenig/keine Kritikalität (im Gegensatz zu einem erneuten Aufbau)
Nach der Anforderung gleicht der DPG-Integrationsprozess die Paritätsblöcke aus. Nur Paritätsblöcke werden auf der ursprünglichen SSD wiederhergestellt (um eine gleichmäßige Paritätsverteilung zu erreichen). Dies geschieht durch Zuweisen, Hinzufügen und Integrieren der neuen SSD.
Cause
Ausfälle einer oder mehrerer SSDs in XtremIO DPG
Resolution
Basierend auf den obigen Informationen kommt es während einer DPG-Neuerstellung/-Integration zu einem gewissen Anstieg der Auslastung der Clusterressourcen, obwohl in der Regel keine spürbare Erhöhung der Performance oder Latenz auftreten sollte. Während einer doppelten DPG-Neuerstellung konzentriert der Cluster jedoch fast alle Ressourcen darauf, die ausgefallenen SSDs so bald wie möglich wiederherzustellen, um die Datenintegrität zu gewährleisten und Datenverlust zu vermeiden. Dies ist vom Design her erwartet und die Leistung sollte nach Abschluss aller Vorgänge wieder normal sein.