ECS: Erasure Coding-Neuaufbau mit Node-Ausfall auf einem ECS-Cluster mit vier Nodes

Summary: Ab ECS-Version 3.4 wird der Erasure Coding-Neuaufbau nicht automatisch initiiert, wenn es in einem ECS-Cluster mit vier Nodes zu einem Node-Ausfall kommt.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Wenn in ECS-Versionen vor 3.4 nur noch drei funktionsfähige Nodes vorhanden waren, initiierte ECS die Wiederherstellung von Kundendaten auf drei gespiegelte Kopien, eine pro Node. Diese Designentscheidung wurde getroffen, um die Data Protection für Kundendaten zu maximieren. Der Prozess wird auch als Stilllegung von EC (Erasure Coding) bezeichnet.

EC ist ein Algorithmus, der den Speicherplatz reduziert und gleichzeitig Daten vor Festplatten- oder Node-Ausfällen schützt.

Wenn Daten mit Erasure Coding versehen werden, beträgt der physische Speicherplatzbedarf auf einem ECS etwa das 1,33-fache für die Speicherung von Kundendaten (12 Datensegmente + 4 Paritätssegmente).  Wenn ECS jedoch mit der Stilllegung von ECS beginnt, erhöht sich der für Kundendaten erforderliche physische Speicherplatz von 1,33-mal auf 3-fach.

Dies kann dazu führen, dass ECS den Kapazitätsauslastungsschwellenwert von 90 % erreicht, was dazu führt, dass ECS in den schreibgeschützten Modus wechselt und Daten nicht verfügbar sind. 

Cause

Während der Stilllegung von ECS in einem ECS erhöht sich der Speicherplatz auf der Festplatte, um 3-fache Kopien von Kundendaten anstelle des üblichen 1,33-fachen Platzbedarfs zu speichern. Selbst auf mäßig genutzten ECSs ist möglicherweise nicht genügend Speicherplatz verfügbar, um die mit Erasure Code versehenen Kundendaten zu entpacken und drei gespiegelte Kopien der Daten zu erstellen. Dieser Prozess kann ECS zu 90 % auslasten, bevor EC-Neuerstellungen abgeschlossen sind, wodurch das Ziel der Maximierung der Data Protection nicht erreicht werden kann. Dies kann dazu führen, dass ECS in den schreibgeschützten Modus wechselt und Daten nicht verfügbar sind.

Resolution

Um die Data Protection zu verbessern und zu vermeiden, dass der Kapazitätsschwellenwert von 90 % überschritten wird, wurde das Standardverhalten für ECS-Cluster mit nur drei fehlerfreien Nodes geändert.

In 3.4 wurde die Designänderung dahingehend vorgenommen, dass ECS die Stilllegung von EC nicht mehr automatisch implementiert, wenn nur drei Nodes funktionsfähig/online sind. Das System wird in einem heruntergestuften Zustand ausgeführt und es können Leistungsprobleme auftreten, aber wahrscheinlich wird eine Nichtverfügbarkeit von Daten vermieden. Neue Schreibvorgänge werden weiterhin als drei gespiegelte Kopien geschrieben und mit Erasure Coding kodiert, sobald 4+ Nodes online und beschreibbar sind.

Jeder zusätzliche Laufwerksausfall kann zu isolierten DUs führen. Dies kann auch das Risiko eines potenziellen Datenverlusts (DL) leicht erhöhen, ist jedoch immer noch unwahrscheinlich.

Ziehen Sie außerdem in Betracht, das ECS auf fünf oder mehr Nodes zu erweitern. Sie verringert die Anfälligkeit von ECS für Performanceeinbußen sowie DU- und DL-Situationen während eines Node-Ausfalls. Weitere Informationen zur ECS-Architektur finden Sie im ECS-Administratorhandbuch. 

Additional Information

*EC ist eine Data-Protection-Methode, mit der Datenblöcke in mehrere Fragmente zerlegt und die Fragmente über Nodes verteilt werden. Erasure Coding (EC) reduziert den Speicheroverhead und sorgt für Datenbeständigkeit und Ausfallsicherheit bei Festplatten- und Node-Ausfällen. Weitere Informationen zu EC finden Sie im ECS-Administrationshandbuch.

Affected Products

ECS Appliance

Products

ECS Appliance, ECS Appliance Gen 1, ECS Appliance Gen 2, ECS Appliance Gen 3, ECS Appliance Hardware Gen3 EX300, ECS Appliance Hardware Gen3 EX3000, ECS Appliance Hardware Gen1 U-Series, ECS Appliance Hardware Gen1 C-Series , ECS Appliance Hardware Gen2 C-Series, ECS Appliance Hardware Gen2 D-Series, ECS Appliance Hardware Gen2 U-Series, ECS Appliance Hardware Gen3 EX500, ECS Appliance Hardware Series, ECS Appliance Software with Encryption, ECS Appliance Software without Encryption, Elastic Cloud Storage ...
Article Properties
Article Number: 000050615
Article Type: Solution
Last Modified: 26 Sept 2025
Version:  5
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.