PowerFlex 不會在關鍵容量閾值重新平衡
摘要: PowerFlex 不會在達到關鍵容量閾值時重新平衡。
症狀
問題說明
根據設計,在關鍵容量使用時不會發生重新平衡。
場景
至少有一個儲存集區正處於使用關鍵容量。
症狀
PowerFlex 無法重新平衡。
這些錯誤訊息會在事件記錄
中看到:DEV_CAPACITY_USAGE_CRITICAL ERROR 保護網域 XX,儲存集區 XXXX 上的容量用量嚴重。
影響
1.SDS 磁碟使用方式和 I/O 負載不會均勻分佈在所有 SDS。
2.如果 SDS 遺失、重建完成,然後 SDS 返回叢集,叢集中所有/大部分的備援容量只能集中到該 SDS 上。這可能會導致後續重建 (在不同的 SDS 斷開連接時) 變慢,因為只有一個 SDS 具有備用容量,並且能夠接收所有其他 SDS 對新斷開連接的 SDS 數據的複寫。
原因
根本原因
無法重新平衡是由於儲存集區的已使用容量百分比達到或超過嚴重使用閾值所造成。這是設計的運作方式,因為在關鍵容量使用時,可能沒有足夠的空間來移動任何 8 GB 梳子。
您可以使用以下公式計算已用容量百分比:
CAPACITY_IN_USE_IN_KB / (MAX_CAPACITY_IN_KB - SPARE_CAPACITY_IN_KB)
即
100411637760 / (114655772672 - 13758692352) = 0.9951 = 99.51%
若要尋找這些值,請在counters_dump.txt (主要 MDM get_info) 中搜尋相關 ID 的儲存集區。
儲存集區位於檔案底部的保護網域和全域編號上方。
解析度
因應措施
唯一的前進方法是將更多設備添加到存儲池。如果目前已填入所有目前的 SDS 節點磁碟機槽,則可能還需要新增新的 SDS 節點。
客戶可以選擇改為停用磁碟區/快照,但這通常無法進行。
如果這兩個選項都無法實現,請使用 L3 開立 JIRA 工單。
受影響的版本
由於此行為是設計使然,因此所有 PowerFlex 版本都會據此行動。