PowerScale:AutoBalanceLinを使用してフル ノード プールからデータを迅速に移動する
Summary: この記事では、AutoBalanceLin ジョブを使用して、1 つのノード プールがいっぱいになった場合、または容量がほぼ 100% になった場合に領域をすばやく解放する方法について説明します。 この手順は、ノードプール上のディスク領域を解放する他のすべての方法を使い果たした場合にのみ使用してください。
Instructions
メモ:次の手順では、既存のファイル プール ポリシーを削除し、データが属するワークフローに関係なく、すべてのノードでデータをストライピングする必要があります。
ファイル プール ポリシーがないと、プール間または階層間でのデータ管理は行われません
パフォーマンスが低下する可能性があるため、この手順の影響を十分に理解していることを確認してください。
これは、容量の問題を解決するための他のすべてのオプションを試した後の最後の手段としてのみ実行してください
AutoBalanceとAutoBalanceLinは、ノード プール内でのみデータのバランスを取り、ノード プール間ではバランスを取らないと広く考えられています。また、2つのノード プール間でデータを移動できるのは、smartpools/smartpoolstreeのみであると考えられています
OneFS 8.0以降でのテストでは、これが完全には当てはまらないことが証明されています。クラスターに「anywhere:anywhere」のデフォルトのファイル プール ポリシーしかない場合、AutoBalanceLinとAutoBalanceは複数のノード プール 間で データを移動します
これは、フル ノード プールが1つしかないクラスターの緊急回避策としてのみ使用してください。このプロセスでは、フル ノード プールからデータを迅速に移動します。
質問:次の手順はどのような場合に使用しますか
答える:この手順は、次の条件が存在する場合に使用されます。
a.クラスターには複数のノード プールがあり、1つ以上のノード プールが100%フルです
b.フル ノード プールのディスク領域をすぐに解放する必要があります
c.データの正確な構成については、当面の懸念事項ではありません
ステップス:
1)クラスターに同梱されている「デフォルト」の「any:any」ファイル プール ポリシーを除き、既存のファイル プール ポリシーをすべてメモしてから削除します。
この手順に進む前に、次のことを行ってください。
a)ポリシーを削除する前に、現在のファイル プール ポリシー構成を記録します。時間に余裕があれば、完全なログ収集をお勧めします。
b)デフォルトでは、Isilonクラスターは、「anywhere:anywhere」にデータを書き込むように設定されたデフォルトのファイル プール ポリシーを使用して構成されます。続行する前に、デフォルト ファイル プール ポリシーがこれらのデフォルト設定に戻っていることを確認します。
Example: Default File Pool Policy. Observe that the Storage Targets are set to 'anywhere'.
# isi filepool default-policy view
Set Requested Protection: default
Data Access Pattern: concurrency
Enable Coalescer: Yes
Enable Packing: No
Data Storage Target: anywhere
Data SSD Strategy: metadata
Snapshot Storage Target: anywhere
Snapshot SSD Strategy: metadata
Cloud Pool: -
Cloud Compression Enabled: -
Cloud Encryption Enabled: -
Cloud Data Retention: -
Cloud Incremental Backup Retention: -
Cloud Full Backup Retention: -
Cloud Accessibility: -
Cloud Read Ahead: -
Cloud Cache Expiration: -
Cloud Writeback Frequency: -
Cloud Archive Snapshot Files: -
ID: -
2)SmartPoolsジョブを実行して、新しいディレクトリー マーキングを適用します。
# isi job start smartpools -p 1 --policy medium
メモ: Anywhere:anywhereのデフォルト ファイル プール ポリシーのみが設定されている場合は、Smartpoolsジョブが通常よりも速く完了すると予想されます。
3)AutoBalanceLinジョブを数時間実行し、領域を監視します。(注:データを移動する前に完全なツリー ウォークを行うAutoBalanceとは異なり、AutoBalanceLinはデータを即座に再ストライプします)
# isi job start autobalancelin -p 1 --policy medium
すぐに、ノード プール間のデータ シフトと、ノード プール全体でディスク領域が解放されることを確認します
メモ: このステップでは、AutoBalanceLinを最後まで実行する必要はありません。フル ノード プールのクリーンアップの目標が達成されるまでAutoBalanceLinジョブを監視してから、ジョブをキャンセルします。たとえば、ノード プール全体が容量の85%まで減少したら、ジョブをキャンセルできます
手記:クラスターの使用率を監視し、スペースに悪影響がある場合は、他のジョブがキャンセルまたは一時停止していることを確認します
次のコマンドを使用して、スペースが十分なレベルになるまで、1時間ごとにスペースを監視し続けます。
# isi stat -p -v
メモ: 繰り返しになりますが、AutoBalanceLinを最後まで実行させることはお勧めできません。ある時点で、ジョブはデータを新しい方向にシフトし、望ましくない結果を生成し始める可能性があります。たとえば、データ移動が逆になり、前のプールが空になると、他のノード プールの容量がフルに近づく可能性があります。AutobalanceLINは数時間だけ、またはスペースがクリーンアップされるまで実行し、目標が達成されたらキャンセルします
クラスターがフル ノード プール上のスペースの軽減を達成したら、AutoBalanceLinジョブをキャンセルします。
# isi job cancel autobalancelin
注意:最適な結果を得るには、ノード プール間の保護レベルを同じ値にする必要があります。
Additional Information
ラボ テストの結果
2つのノード プール、等しい保護レベル
これは次の前です。
Node Pool Name: x410_archive Protection: +2d:1n Pool Storage: HDD SSD Storage Size: 85.2T (94.6T Raw) 2.2T (2.2T Raw) VHS Size: 9.4T Used: 29.9T (35%) 35.2G (2%) Avail: 55.3T (65%) 2.1T (98%) Throughput (bps) HDD Storage SSD Storage Name Health| In Out Total| Used / Size |Used / Size -------------------+-----+-----+-----+-----+-----------------+----------------- 5|10.5.80.190 | OK |881.6| 0|881.6|10.0T/31.5T( 32%)|11.7G/ 738G( 2%) 6|10.5.80.191 |-A-- | 0| 0| 0|10.0T/31.5T( 32%)|11.7G/ 738G( 2%) 7|10.5.80.192 | OK | 0| 0| 0|10.0T/31.5T( 32%)|11.7G/ 738G( 2%) -------------------+-----+-----+-----+-----+-----------------+----------------- x410_archive | OK |110.2| 0|110.2|29.9T/85.2T( 35%)|35.2G/ 2.2T( 2%) Node Pool Name: x410_35tb_800gb-ssd_64gbProtection: +2d:1n Pool Storage: HDD SSD Storage Size: 112.8T (125.3T Raw) 2.9T (2.9T Raw) VHS Size: 12.5T Used: 5.6T (5%) 7.9G (< 1%) Avail: 107.2T (95%) 2.9T (> 99%) Throughput (bps) HDD Storage SSD Storage Name Health| In Out Total| Used / Size |Used / Size -------------------+-----+-----+-----+-----+-----------------+----------------- 1|10.5.80.186 | OK | 2.9M|82.8M|85.6M| 1.4T/31.5T( 4%)| 2.0G/ 738G(< 1%) 2|10.5.80.187 |-A-- | 104k|38.8k| 143k| 1.4T/30.6T( 5%)| 1.9G/ 738G(< 1%) 3|10.5.80.188 | OK |881.6| 0|881.6| 1.4T/31.5T( 4%)| 2.0G/ 738G(< 1%) 4|10.5.80.189 | OK | 0|25.8k|25.8k| 1.4T/31.5T( 4%)| 2.0G/ 738G(< 1%) -------------------+-----+-----+-----+-----+-----------------+----------------- x410_35tb_800gb-ssd|-M---| 371k|10.4M|10.7M| 5.6T/112.8T( 5%)| 7.9G/ 2.9T(< 1%) _64gb | | | | | | X410-2# date Thu Jun 14 16:53:29 CDT 2018 one filepool policy set to default any:any X410-2# isi job start autobalancelin -p 1 --policy medium Started job [7159] in as little as 30 minutes you will see data shift between the two pools, i.e. our first node pool, below, dropped from 32% full to 29% X410-2# date Thu Jun 14 17:24:20 CDT 2018 Node Pool Name: x410_archive Protection: +2d:1n Pool Storage: HDD SSD Storage Size: 85.2T (94.6T Raw) 2.2T (2.2T Raw) VHS Size: 9.4T Used: 27.7T (33%) 34.3G (2%) Avail: 57.5T (67%) 2.1T (98%) Throughput (bps) HDD Storage SSD Storage Name Health| In Out Total| Used / Size |Used / Size -------------------+-----+-----+-----+-----+-----------------+----------------- 5|10.5.80.190 | OK | 1.1k|25.8k|26.9k| 9.2T/31.5T( 29%)|11.4G/ 738G( 2%) 6|10.5.80.191 |-A-- | 1.1k| 1.2M| 1.2M| 9.2T/31.5T( 29%)|11.4G/ 738G( 2%) 7|10.5.80.192 | OK |28.6k| 5.2k|33.7k| 9.2T/31.5T( 29%)|11.4G/ 738G( 2%) -------------------+-----+-----+-----+-----+-----------------+----------------- x410_archive | OK | 3.8k| 152k| 156k|27.7T/85.2T( 33%)|34.3G/ 2.2T( 2%) Node Pool Name: x410_35tb_800gb-ssd_64gbProtection: +2d:1n Pool Storage: HDD SSD Storage Size: 112.8T (125.3T Raw) 2.9T (2.9T Raw) VHS Size: 12.5T Used: 7.6T (7%) 8.8G (< 1%) Avail: 105.2T (93%) 2.9T (> 99%) Throughput (bps) HDD Storage SSD Storage Name Health| In Out Total| Used / Size |Used / Size -------------------+-----+-----+-----+-----+-----------------+----------------- 1|10.5.80.186 | OK |37.9k| 279k| 316k| 1.9T/31.5T( 6%)| 2.2G/ 738G(< 1%) 2|10.5.80.187 |-A-- | 1.4M|34.8M|36.2M| 1.9T/30.6T( 6%)| 2.2G/ 738G(< 1%) 3|10.5.80.188 | OK | 130k|30.9k| 161k| 1.9T/31.5T( 6%)| 2.2G/ 738G(< 1%) 4|10.5.80.189 | OK | 0| 0| 0| 1.9T/31.5T( 6%)| 2.2G/ 738G(< 1%) -------------------+-----+-----+-----+-----+-----------------+----------------- x410_35tb_800gb-ssd|-M---| 198k| 4.4M| 4.6M| 7.6T/112.8T( 7%)| 8.8G/ 2.9T(< 1%) _64gb | | | | | |
ディスク領域が十分なレベルになるまで、1時間ごとに監視を続けます
メモ: AutoBalanceLinの実行を完了させないでください。ジョブはデータを逆方向にシフトするため、望ましくない結果が生じ始める可能性があります。消費されたディスク領域が逆転し、ノード プールが再び満杯近くになる可能性があります。ジョブを数時間だけ実行します。
1時間のポイント:
X410-2# date Thu Jun 14 17:54:30 CDT 2018 Node Pool Name: x410_archive Protection: +2d:1n Pool Storage: HDD SSD Storage Size: 85.2T (94.6T Raw) 2.2T (2.2T Raw) VHS Size: 9.4T Used: 25.2T (30%) 33.9G (2%) Avail: 60.0T (70%) 2.1T (98%) Throughput (bps) HDD Storage SSD Storage Name Health| In Out Total| Used / Size |Used / Size -------------------+-----+-----+-----+-----+-----------------+----------------- 5|10.5.80.190 | OK |881.6|20.6k|21.5k| 8.4T/31.5T( 27%)|11.3G/ 738G( 2%) 6|10.5.80.191 |-A-- | 0| 0| 0| 8.4T/31.5T( 27%)|11.3G/ 738G( 2%) 7|10.5.80.192 | OK | 2.2k| 216k| 218k| 8.4T/31.5T( 27%)|11.3G/ 738G( 2%) -------------------+-----+-----+-----+-----+-----------------+----------------- x410_archive | OK |385.7|29.5k|29.9k|25.2T/85.2T( 30%)|33.9G/ 2.2T( 2%) X410-2# date Thu Jun 14 18:54:43 CDT 2018 Node Pool Name: x410_archive Protection: +2d:1n Pool Storage: HDD SSD Storage Size: 85.2T (94.6T Raw) 2.2T (2.2T Raw) VHS Size: 9.4T Used: 21.6T (25%) 26.8G (1%) Avail: 63.6T (75%) 2.1T (99%) Throughput (bps) HDD Storage SSD Storage Name Health| In Out Total| Used / Size |Used / Size -------------------+-----+-----+-----+-----+-----------------+----------------- 5|10.5.80.190 | OK |22.9k| 1.4M| 1.5M| 7.2T/31.5T( 23%)| 8.9G/ 738G( 1%) 6|10.5.80.191 |-A-- |881.6| 231k| 232k| 7.2T/31.5T( 23%)| 8.9G/ 738G( 1%) 7|10.5.80.192 | OK | 0| 0| 0| 7.2T/31.5T( 23%)| 8.9G/ 738G( 1%) -------------------+-----+-----+-----+-----+-----------------+----------------- x410_archive | OK | 3.0k| 210k| 213k|21.6T/85.2T( 25%)|26.8G/ 2.2T( 1%)
スペースは十分にクリーンアップされています。AutoBalanceLInジョブは、目的の結果が達成されたためキャンセルできます。