PowerScale:使用 AutoBalanceLin 將資料從完整節點集區快速移出
Summary: 本文說明如果單一節點集區已滿或幾乎達到 100% 容量,如何使用 AutoBalanceLin 工作快速釋放空間。 僅當節點池上釋放磁碟空間的所有其他方法都已用盡時,才應使用此程式。
Instructions
注意:以下過程要求刪除現有檔池策略,並在所有節點上對數據進行條帶化 ,而不考慮數據所屬的工作流。
如果沒有檔池策略,則不會在池或層之間進行數據管理。
請確保完全瞭解此過程的影響,因為它可能會導致性能下降。
只有在嘗試過解決容量問題的所有其他選項後,才做最後的努力。
人們普遍認為,AutoBalance和AutoBalanceLin 只平衡節點池內的數據,而不是跨節點池。此外,人們認為只有 smartpools/smartpoolstree 才能在兩個節點集區之間移動資料。
OneFS 8.0 及以上版本的測試證明這並不完全正確。如果叢集僅具有「anywhere:anywhere」的預設檔案集區原則,AutoBalanceLin 和 AutoBalance 便會 將 資料移動至多個節點集區。
這只能作為具有一個完整節點池的群集的緊急解決方法。此過程會將數據從整個節點池中快速移出。
鞫:何時要使用下列程序?
答:當存在以下條件時,將使用此過程:
a。群集包含多個節點池,並且一個或多個節點池已滿 100%。
b.立即需要釋放完整節點池上的磁碟空間。
c.數據的確切組織並不是一個直接的問題。
階:
1) 記下並刪除所有現有的檔案集區原則,但叢集隨附的「預設」「any:any」檔案集區原則除外。
繼續執行此步驟之前:
a) 在刪除策略之前記錄當前的檔池策略配置。如果時間允許,建議進行完整日誌收集。
b) 依預設,Isilon 叢集的預設檔案集區原則設定為將資料寫入「anywhere:anywhere」。在繼續之前,請確認預設檔池策略已恢復為這些預設設置。
Example: Default File Pool Policy. Observe that the Storage Targets are set to 'anywhere'.
# isi filepool default-policy view
Set Requested Protection: default
Data Access Pattern: concurrency
Enable Coalescer: Yes
Enable Packing: No
Data Storage Target: anywhere
Data SSD Strategy: metadata
Snapshot Storage Target: anywhere
Snapshot SSD Strategy: metadata
Cloud Pool: -
Cloud Compression Enabled: -
Cloud Encryption Enabled: -
Cloud Data Retention: -
Cloud Incremental Backup Retention: -
Cloud Full Backup Retention: -
Cloud Accessibility: -
Cloud Read Ahead: -
Cloud Cache Expiration: -
Cloud Writeback Frequency: -
Cloud Archive Snapshot Files: -
ID: -
2) 執行 SmartPools 工作以套用新的目錄標記:
# isi job start smartpools -p 1 --policy medium
注意:預計 Smartpools 工作會比平常更快完成,只有 anywhere:anywhere 的預設檔案集區原則就位。
3) 執行 AutoBalanceLin 工作數小時,並監控空間。(注意:與 AutoBalance 不同,AutoBalance 會在移動任何資料前執行完整的樹狀追蹤,而 AutoBalanceLin 會立即重新等量化資料)
# isi job start autobalancelin -p 1 --policy medium
幾乎可以立即觀察到數據在節點池之間移動,並且完整節點池應釋放磁碟空間。
注意:在此步驟中,AutoBalanceLin 不需要執行至完成。監控 AutoBalanceLin 工作,直到達到清理完整節點集區的目標,然後取消工作。例如,一旦完整節點池的容量降至 85%,就可以取消作業。
便條:監控叢集使用率,並確認如果空間受到不良影響,其他工作已取消或暫停。
使用下列命令,繼續每小時監控一次空間,直到空間達到足夠的層級:
# isi stat -p -v
注意:同樣地,不建議讓 AutoBalanceLin 執行至完成。在某個時候,作業可能會將數據轉移到新的方向,並且可能會開始產生不良結果。例如,這會反向資料移動,在前一個集區清空時,可能會導致其他節點集區容量接近滿載。僅執行 AutobalanceLIN 數小時,或等到空間清理乾淨為止,然後在目標達成後取消。
當叢集達到完整節點集區的空間緩解後,請取消 AutoBalanceLin 工作:
# isi job cancel autobalancelin
注意:為了獲得最佳結果,節點池之間的保護級別應具有相同的值。
Additional Information
實驗室測試結果
兩個節點集區,同等的保護等級
這是之前:
Node Pool Name: x410_archive Protection: +2d:1n Pool Storage: HDD SSD Storage Size: 85.2T (94.6T Raw) 2.2T (2.2T Raw) VHS Size: 9.4T Used: 29.9T (35%) 35.2G (2%) Avail: 55.3T (65%) 2.1T (98%) Throughput (bps) HDD Storage SSD Storage Name Health| In Out Total| Used / Size |Used / Size -------------------+-----+-----+-----+-----+-----------------+----------------- 5|10.5.80.190 | OK |881.6| 0|881.6|10.0T/31.5T( 32%)|11.7G/ 738G( 2%) 6|10.5.80.191 |-A-- | 0| 0| 0|10.0T/31.5T( 32%)|11.7G/ 738G( 2%) 7|10.5.80.192 | OK | 0| 0| 0|10.0T/31.5T( 32%)|11.7G/ 738G( 2%) -------------------+-----+-----+-----+-----+-----------------+----------------- x410_archive | OK |110.2| 0|110.2|29.9T/85.2T( 35%)|35.2G/ 2.2T( 2%) Node Pool Name: x410_35tb_800gb-ssd_64gbProtection: +2d:1n Pool Storage: HDD SSD Storage Size: 112.8T (125.3T Raw) 2.9T (2.9T Raw) VHS Size: 12.5T Used: 5.6T (5%) 7.9G (< 1%) Avail: 107.2T (95%) 2.9T (> 99%) Throughput (bps) HDD Storage SSD Storage Name Health| In Out Total| Used / Size |Used / Size -------------------+-----+-----+-----+-----+-----------------+----------------- 1|10.5.80.186 | OK | 2.9M|82.8M|85.6M| 1.4T/31.5T( 4%)| 2.0G/ 738G(< 1%) 2|10.5.80.187 |-A-- | 104k|38.8k| 143k| 1.4T/30.6T( 5%)| 1.9G/ 738G(< 1%) 3|10.5.80.188 | OK |881.6| 0|881.6| 1.4T/31.5T( 4%)| 2.0G/ 738G(< 1%) 4|10.5.80.189 | OK | 0|25.8k|25.8k| 1.4T/31.5T( 4%)| 2.0G/ 738G(< 1%) -------------------+-----+-----+-----+-----+-----------------+----------------- x410_35tb_800gb-ssd|-M---| 371k|10.4M|10.7M| 5.6T/112.8T( 5%)| 7.9G/ 2.9T(< 1%) _64gb | | | | | | X410-2# date Thu Jun 14 16:53:29 CDT 2018 one filepool policy set to default any:any X410-2# isi job start autobalancelin -p 1 --policy medium Started job [7159] in as little as 30 minutes you will see data shift between the two pools, i.e. our first node pool, below, dropped from 32% full to 29% X410-2# date Thu Jun 14 17:24:20 CDT 2018 Node Pool Name: x410_archive Protection: +2d:1n Pool Storage: HDD SSD Storage Size: 85.2T (94.6T Raw) 2.2T (2.2T Raw) VHS Size: 9.4T Used: 27.7T (33%) 34.3G (2%) Avail: 57.5T (67%) 2.1T (98%) Throughput (bps) HDD Storage SSD Storage Name Health| In Out Total| Used / Size |Used / Size -------------------+-----+-----+-----+-----+-----------------+----------------- 5|10.5.80.190 | OK | 1.1k|25.8k|26.9k| 9.2T/31.5T( 29%)|11.4G/ 738G( 2%) 6|10.5.80.191 |-A-- | 1.1k| 1.2M| 1.2M| 9.2T/31.5T( 29%)|11.4G/ 738G( 2%) 7|10.5.80.192 | OK |28.6k| 5.2k|33.7k| 9.2T/31.5T( 29%)|11.4G/ 738G( 2%) -------------------+-----+-----+-----+-----+-----------------+----------------- x410_archive | OK | 3.8k| 152k| 156k|27.7T/85.2T( 33%)|34.3G/ 2.2T( 2%) Node Pool Name: x410_35tb_800gb-ssd_64gbProtection: +2d:1n Pool Storage: HDD SSD Storage Size: 112.8T (125.3T Raw) 2.9T (2.9T Raw) VHS Size: 12.5T Used: 7.6T (7%) 8.8G (< 1%) Avail: 105.2T (93%) 2.9T (> 99%) Throughput (bps) HDD Storage SSD Storage Name Health| In Out Total| Used / Size |Used / Size -------------------+-----+-----+-----+-----+-----------------+----------------- 1|10.5.80.186 | OK |37.9k| 279k| 316k| 1.9T/31.5T( 6%)| 2.2G/ 738G(< 1%) 2|10.5.80.187 |-A-- | 1.4M|34.8M|36.2M| 1.9T/30.6T( 6%)| 2.2G/ 738G(< 1%) 3|10.5.80.188 | OK | 130k|30.9k| 161k| 1.9T/31.5T( 6%)| 2.2G/ 738G(< 1%) 4|10.5.80.189 | OK | 0| 0| 0| 1.9T/31.5T( 6%)| 2.2G/ 738G(< 1%) -------------------+-----+-----+-----+-----+-----------------+----------------- x410_35tb_800gb-ssd|-M---| 198k| 4.4M| 4.6M| 7.6T/112.8T( 7%)| 8.8G/ 2.9T(< 1%) _64gb | | | | | |
繼續每小時監視一次,直到磁碟空間達到足夠的水準。
注意:請勿讓 AutoBalanceLin 執行至完成。作業將數據轉移到相反的方向,這可能會開始產生不良結果。耗用的磁碟空間可能會反轉,可能會導致節點集區再次接近滿載。僅運行作業幾個小時。
一小時點:
X410-2# date Thu Jun 14 17:54:30 CDT 2018 Node Pool Name: x410_archive Protection: +2d:1n Pool Storage: HDD SSD Storage Size: 85.2T (94.6T Raw) 2.2T (2.2T Raw) VHS Size: 9.4T Used: 25.2T (30%) 33.9G (2%) Avail: 60.0T (70%) 2.1T (98%) Throughput (bps) HDD Storage SSD Storage Name Health| In Out Total| Used / Size |Used / Size -------------------+-----+-----+-----+-----+-----------------+----------------- 5|10.5.80.190 | OK |881.6|20.6k|21.5k| 8.4T/31.5T( 27%)|11.3G/ 738G( 2%) 6|10.5.80.191 |-A-- | 0| 0| 0| 8.4T/31.5T( 27%)|11.3G/ 738G( 2%) 7|10.5.80.192 | OK | 2.2k| 216k| 218k| 8.4T/31.5T( 27%)|11.3G/ 738G( 2%) -------------------+-----+-----+-----+-----+-----------------+----------------- x410_archive | OK |385.7|29.5k|29.9k|25.2T/85.2T( 30%)|33.9G/ 2.2T( 2%) X410-2# date Thu Jun 14 18:54:43 CDT 2018 Node Pool Name: x410_archive Protection: +2d:1n Pool Storage: HDD SSD Storage Size: 85.2T (94.6T Raw) 2.2T (2.2T Raw) VHS Size: 9.4T Used: 21.6T (25%) 26.8G (1%) Avail: 63.6T (75%) 2.1T (99%) Throughput (bps) HDD Storage SSD Storage Name Health| In Out Total| Used / Size |Used / Size -------------------+-----+-----+-----+-----+-----------------+----------------- 5|10.5.80.190 | OK |22.9k| 1.4M| 1.5M| 7.2T/31.5T( 23%)| 8.9G/ 738G( 1%) 6|10.5.80.191 |-A-- |881.6| 231k| 232k| 7.2T/31.5T( 23%)| 8.9G/ 738G( 1%) 7|10.5.80.192 | OK | 0| 0| 0| 7.2T/31.5T( 23%)| 8.9G/ 738G( 1%) -------------------+-----+-----+-----+-----+-----------------+----------------- x410_archive | OK | 3.0k| 210k| 213k|21.6T/85.2T( 25%)|26.8G/ 2.2T( 1%)
空間得到充分清理。AutoBalanceLIn 作業可以取消,因為已達到所需的結果。