ECS:在四節點 ECS 叢集上,在節點服務中斷期間重新建置糾刪碼

Summary: 從 ECS 3.4 版開始,如果四節點 ECS 叢集發生節點服務中斷,則不會自動啟動糾刪碼重新建置。

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

在 3.4 版之前的 ECS 版本中,如果只剩下三個狀況良好的節點,ECS 會啟動將客戶資料還原至三個鏡像複本,每個節點一份。做出此設計決策是為了最大限度地保護客戶數據。此程序也稱為 EC (糾刪碼) 淘汰。

EC 是一種減少儲存空間的演算法,同時保護資料免受磁碟或節點故障的影響。

進行資料糾刪碼時,ECS 儲存客戶資料所需的實體空間約為 1.33 倍 (12 個資料區段 + 4 個同位檢查區段)。  但是,如果 ECS 開始 EC 淘汰,客戶資料所需的實體空間將從 1.33 倍增加到 3 倍。

這可能會導致彈性雲伺服器達到90%的容量使用率閾值,導致彈性雲伺服器進入唯讀模式和數據不可用。 

Cause

在 ECS 中停用 EC 期間,硬碟空間會增加,以儲存 3 倍的客戶資料副本,而非通常的 1.33 倍佔用空間。即使在適度使用的彈性雲伺服器上,也可能沒有足夠的空間來解壓縮已清除編碼的客戶數據並創建數據的三個鏡像副本。此程序可在 EC 重建完成之前將 ECS 填滿至 90% 的容量,導致無法實現最大化資料保護的目標。這可能會導致彈性雲伺服器進入唯讀模式,並可能導致數據不可用。

Resolution

為強化資料保護並避免超過 90% 容量閾值,已變更僅有三個健全節點之 ECS 叢集的預設行為。

在 3.4 中進行設計變更,使得 ECS 將不再在只有三個節點狀況良好/連線時自動執行 EC 淘汰。系統在效能降低狀態下執行,可能會遇到效能問題,但可能會避免 DU。新的寫入會繼續寫入為三個鏡像複本,並且在有 4+ 個節點可供寫入時進行抹除編碼。

任何其他的磁碟機故障都可能會導致孤立的 DU,也可能會稍微增加潛在的資料遺失 (DL) 風險,但仍然不太可能發生。

此外,請考慮將 ECS 擴展到五個或更多節點。在節點故障期間,可減少 ECS 暴露於效能下降、DU 和 DL 情況的風險。如需更多 ECS 架構的詳細資料,請參閱 ECS 管理員指南。 

Additional Information

*EC 是一種數據保護方法,可將數據塊分解為多個片段,並將片段分佈到各個節點。糾刪碼 (EC) 可減少儲存開銷,並確保資料持久性,以及磁碟和節點故障時的復原能力。有關 EC 的更多資訊,請參閱 ECS 管理指南。

Affected Products

ECS Appliance

Products

ECS Appliance, ECS Appliance Gen 1, ECS Appliance Gen 2, ECS Appliance Gen 3, ECS Appliance Hardware Gen3 EX300, ECS Appliance Hardware Gen3 EX3000, ECS Appliance Hardware Gen1 U-Series, ECS Appliance Hardware Gen1 C-Series , ECS Appliance Hardware Gen2 C-Series, ECS Appliance Hardware Gen2 D-Series, ECS Appliance Hardware Gen2 U-Series, ECS Appliance Hardware Gen3 EX500, ECS Appliance Hardware Series, ECS Appliance Software with Encryption, ECS Appliance Software without Encryption, Elastic Cloud Storage ...
Article Properties
Article Number: 000050615
Article Type: Solution
Last Modified: 26 Sept 2025
Version:  5
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.