PowerScale: Utilizzo di AutoBalanceLin per spostare rapidamente i dati da un pool di nodi completo
Summary: Questo articolo descrive come utilizzare il processo AutoBalanceLin per liberare rapidamente spazio se un pool a singolo nodo è pieno o quasi al 100% della capacità. Questa procedura deve essere utilizzata solo se sono stati esauriti tutti gli altri metodi per liberare spazio su disco in un pool di nodi. ...
Instructions
Nota: La procedura seguente richiede la rimozione delle policy del pool di file esistenti e lo striping dei dati su tutti i nodi, indipendentemente dal flusso di lavoro a cui appartengono i dati.
Senza le policy del pool di file, non si verifica alcuna gestione dei dati tra i pool o i tier.
Assicurarsi di comprendere appieno l'impatto di questa procedura, in quanto potrebbe causare una riduzione delle prestazioni.
Eseguire questa operazione è solo come ultimo tentativo dopo aver tentato tutte le altre opzioni per la risoluzione dei problemi di capacità.
È opinione diffusa che AutoBalance e AutoBalanceLin bilancino i dati solo all'interno dei pool di nodi e non tra i pool di nodi. Inoltre, si ritiene che solo smartpools/smartpoolstree possa spostare i dati tra due pool di nodi.
I test su OneFS 8.0 e versioni successive dimostrano che questo non è del tutto vero. Se il cluster dispone solo della policy predefinita del pool di file "anywhere:anywhere", AutoBalanceLin e AutoBalance spostano i dati in più pool di nodi.
Questa operazione deve essere utilizzata solo come soluzione alternativa di emergenza per i cluster che dispongono di un pool di nodi completo. Questo processo sposta rapidamente i dati al di fuori del pool di nodi completo.
Domanda: Quando si desidera utilizzare la seguente procedura?
Risposta: Questa procedura viene utilizzata quando sussistono le seguenti condizioni:
a. Il cluster contiene più pool di nodi e uno o più pool di nodi sono pieni al 100%.
b. Esiste un requisito immediato per liberare spazio su disco in un pool di nodi completo.
c. L'organizzazione esatta dei dati non è un problema immediato.
Passi:
1) Prendere nota, quindi eliminare, tutte le policy del pool di file esistenti ad eccezione della policy del pool di file "default" "any:any" fornita con il cluster.
Prima di procedere con questo passaggio:
a) Registrare la configurazione corrente della policy del pool di file prima di rimuovere le policy. Se il tempo lo consente, si consiglia di raccogliere il registro completo.
b) Per impostazione predefinita, i cluster Isilon sono configurati con l'impostazione predefinita - File Pool Policy per la scrittura dei dati in "anywhere:anywhere". Prima di procedere, verificare che la policy del pool di file predefinita sia stata ripristinata a queste impostazioni predefinite.
Example: Default File Pool Policy. Observe that the Storage Targets are set to 'anywhere'.
# isi filepool default-policy view
Set Requested Protection: default
Data Access Pattern: concurrency
Enable Coalescer: Yes
Enable Packing: No
Data Storage Target: anywhere
Data SSD Strategy: metadata
Snapshot Storage Target: anywhere
Snapshot SSD Strategy: metadata
Cloud Pool: -
Cloud Compression Enabled: -
Cloud Encryption Enabled: -
Cloud Data Retention: -
Cloud Incremental Backup Retention: -
Cloud Full Backup Retention: -
Cloud Accessibility: -
Cloud Read Ahead: -
Cloud Cache Expiration: -
Cloud Writeback Frequency: -
Cloud Archive Snapshot Files: -
ID: -
2) Eseguire un lavoro SmartPools per applicare nuove contrassegni di directory:
# isi job start smartpools -p 1 --policy medium
Nota: Si prevede che il processo Smartpools venga completato più velocemente del solito con solo la policy del pool di file predefinita anywhere:anywhere.
3) Eseguire un processo AutoBalanceLin per alcune ore e monitorare lo spazio. Nota: a differenza di AutoBalance, che esegue un percorso completo della struttura ad albero prima di spostare i dati, AutoBalanceLin esegue immediatamente il restriping dei dati.
# isi job start autobalancelin -p 1 --policy medium
Quasi immediatamente, osservare che i dati si spostano tra i pool di nodi e il pool di nodi completo dovrebbe liberarsi spazio su disco.
Nota: Per questo passaggio, AutoBalanceLin non deve essere eseguito fino al completamento. Monitorare il processo AutoBalanceLin fino a raggiungere l'obiettivo di pulizia del pool di nodi completo, quindi annullare il processo. Ad esempio, è possibile annullare il processo una volta che il pool di nodi completi è sceso all'85% della capacità.
Nota: Monitorare l'utilizzo del cluster e verificare che gli altri lavori vengano annullati o sospesi se lo spazio viene influenzato negativamente.
Continuare a monitorare lo spazio ogni ora circa fino a quando lo spazio non raggiunge un livello sufficiente utilizzando il seguente comando:
# isi stat -p -v
Nota: Anche in questo caso, non è consigliabile lasciare che AutoBalanceLin venga eseguito fino al completamento. A un certo punto, il lavoro potrebbe spostare i dati in una nuova direzione e potrebbe iniziare a produrre risultati indesiderati. Ad esempio, inverte lo spostamento dei dati, portando eventualmente l'altro pool di nodi a raggiungere la piena capacità mentre il pool precedente si svuota. Eseguire AutobalanceLIN solo per poche ore o fino a quando lo spazio non viene ripulito, quindi annullare una volta raggiunto l'obiettivo.
Una volta che il cluster ha ottenuto lo sgravio nello spazio sul pool di nodi completo, annullare il processo AutoBalanceLin:
# isi job cancel autobalancelin
Nota: per ottenere risultati ottimali, i livelli di protezione tra i pool di nodi devono avere lo stesso valore.
Additional Information
Risultati
dei test di laboratorio Due pool di nodi, uguali livelli
di protezione Ciò avviene prima:
Node Pool Name: x410_archive Protection: +2d:1n Pool Storage: HDD SSD Storage Size: 85.2T (94.6T Raw) 2.2T (2.2T Raw) VHS Size: 9.4T Used: 29.9T (35%) 35.2G (2%) Avail: 55.3T (65%) 2.1T (98%) Throughput (bps) HDD Storage SSD Storage Name Health| In Out Total| Used / Size |Used / Size -------------------+-----+-----+-----+-----+-----------------+----------------- 5|10.5.80.190 | OK |881.6| 0|881.6|10.0T/31.5T( 32%)|11.7G/ 738G( 2%) 6|10.5.80.191 |-A-- | 0| 0| 0|10.0T/31.5T( 32%)|11.7G/ 738G( 2%) 7|10.5.80.192 | OK | 0| 0| 0|10.0T/31.5T( 32%)|11.7G/ 738G( 2%) -------------------+-----+-----+-----+-----+-----------------+----------------- x410_archive | OK |110.2| 0|110.2|29.9T/85.2T( 35%)|35.2G/ 2.2T( 2%) Node Pool Name: x410_35tb_800gb-ssd_64gbProtection: +2d:1n Pool Storage: HDD SSD Storage Size: 112.8T (125.3T Raw) 2.9T (2.9T Raw) VHS Size: 12.5T Used: 5.6T (5%) 7.9G (< 1%) Avail: 107.2T (95%) 2.9T (> 99%) Throughput (bps) HDD Storage SSD Storage Name Health| In Out Total| Used / Size |Used / Size -------------------+-----+-----+-----+-----+-----------------+----------------- 1|10.5.80.186 | OK | 2.9M|82.8M|85.6M| 1.4T/31.5T( 4%)| 2.0G/ 738G(< 1%) 2|10.5.80.187 |-A-- | 104k|38.8k| 143k| 1.4T/30.6T( 5%)| 1.9G/ 738G(< 1%) 3|10.5.80.188 | OK |881.6| 0|881.6| 1.4T/31.5T( 4%)| 2.0G/ 738G(< 1%) 4|10.5.80.189 | OK | 0|25.8k|25.8k| 1.4T/31.5T( 4%)| 2.0G/ 738G(< 1%) -------------------+-----+-----+-----+-----+-----------------+----------------- x410_35tb_800gb-ssd|-M---| 371k|10.4M|10.7M| 5.6T/112.8T( 5%)| 7.9G/ 2.9T(< 1%) _64gb | | | | | | X410-2# date Thu Jun 14 16:53:29 CDT 2018 one filepool policy set to default any:any X410-2# isi job start autobalancelin -p 1 --policy medium Started job [7159] in as little as 30 minutes you will see data shift between the two pools, i.e. our first node pool, below, dropped from 32% full to 29% X410-2# date Thu Jun 14 17:24:20 CDT 2018 Node Pool Name: x410_archive Protection: +2d:1n Pool Storage: HDD SSD Storage Size: 85.2T (94.6T Raw) 2.2T (2.2T Raw) VHS Size: 9.4T Used: 27.7T (33%) 34.3G (2%) Avail: 57.5T (67%) 2.1T (98%) Throughput (bps) HDD Storage SSD Storage Name Health| In Out Total| Used / Size |Used / Size -------------------+-----+-----+-----+-----+-----------------+----------------- 5|10.5.80.190 | OK | 1.1k|25.8k|26.9k| 9.2T/31.5T( 29%)|11.4G/ 738G( 2%) 6|10.5.80.191 |-A-- | 1.1k| 1.2M| 1.2M| 9.2T/31.5T( 29%)|11.4G/ 738G( 2%) 7|10.5.80.192 | OK |28.6k| 5.2k|33.7k| 9.2T/31.5T( 29%)|11.4G/ 738G( 2%) -------------------+-----+-----+-----+-----+-----------------+----------------- x410_archive | OK | 3.8k| 152k| 156k|27.7T/85.2T( 33%)|34.3G/ 2.2T( 2%) Node Pool Name: x410_35tb_800gb-ssd_64gbProtection: +2d:1n Pool Storage: HDD SSD Storage Size: 112.8T (125.3T Raw) 2.9T (2.9T Raw) VHS Size: 12.5T Used: 7.6T (7%) 8.8G (< 1%) Avail: 105.2T (93%) 2.9T (> 99%) Throughput (bps) HDD Storage SSD Storage Name Health| In Out Total| Used / Size |Used / Size -------------------+-----+-----+-----+-----+-----------------+----------------- 1|10.5.80.186 | OK |37.9k| 279k| 316k| 1.9T/31.5T( 6%)| 2.2G/ 738G(< 1%) 2|10.5.80.187 |-A-- | 1.4M|34.8M|36.2M| 1.9T/30.6T( 6%)| 2.2G/ 738G(< 1%) 3|10.5.80.188 | OK | 130k|30.9k| 161k| 1.9T/31.5T( 6%)| 2.2G/ 738G(< 1%) 4|10.5.80.189 | OK | 0| 0| 0| 1.9T/31.5T( 6%)| 2.2G/ 738G(< 1%) -------------------+-----+-----+-----+-----+-----------------+----------------- x410_35tb_800gb-ssd|-M---| 198k| 4.4M| 4.6M| 7.6T/112.8T( 7%)| 8.8G/ 2.9T(< 1%) _64gb | | | | | |
Continuare a monitorare ogni ora circa fino a quando lo spazio su disco non è a un livello sufficiente.
Nota: Non lasciare che AutoBalanceLin venga eseguito fino al completamento. Il lavoro sposta i dati nella direzione opposta, il che può iniziare a produrre risultati indesiderati. Lo spazio su disco utilizzato può essere invertito, portando eventualmente a un pool di nodi quasi pieno. Eseguire il processo solo per poche ore.
Punto di un'ora:
X410-2# date Thu Jun 14 17:54:30 CDT 2018 Node Pool Name: x410_archive Protection: +2d:1n Pool Storage: HDD SSD Storage Size: 85.2T (94.6T Raw) 2.2T (2.2T Raw) VHS Size: 9.4T Used: 25.2T (30%) 33.9G (2%) Avail: 60.0T (70%) 2.1T (98%) Throughput (bps) HDD Storage SSD Storage Name Health| In Out Total| Used / Size |Used / Size -------------------+-----+-----+-----+-----+-----------------+----------------- 5|10.5.80.190 | OK |881.6|20.6k|21.5k| 8.4T/31.5T( 27%)|11.3G/ 738G( 2%) 6|10.5.80.191 |-A-- | 0| 0| 0| 8.4T/31.5T( 27%)|11.3G/ 738G( 2%) 7|10.5.80.192 | OK | 2.2k| 216k| 218k| 8.4T/31.5T( 27%)|11.3G/ 738G( 2%) -------------------+-----+-----+-----+-----+-----------------+----------------- x410_archive | OK |385.7|29.5k|29.9k|25.2T/85.2T( 30%)|33.9G/ 2.2T( 2%) X410-2# date Thu Jun 14 18:54:43 CDT 2018 Node Pool Name: x410_archive Protection: +2d:1n Pool Storage: HDD SSD Storage Size: 85.2T (94.6T Raw) 2.2T (2.2T Raw) VHS Size: 9.4T Used: 21.6T (25%) 26.8G (1%) Avail: 63.6T (75%) 2.1T (99%) Throughput (bps) HDD Storage SSD Storage Name Health| In Out Total| Used / Size |Used / Size -------------------+-----+-----+-----+-----+-----------------+----------------- 5|10.5.80.190 | OK |22.9k| 1.4M| 1.5M| 7.2T/31.5T( 23%)| 8.9G/ 738G( 1%) 6|10.5.80.191 |-A-- |881.6| 231k| 232k| 7.2T/31.5T( 23%)| 8.9G/ 738G( 1%) 7|10.5.80.192 | OK | 0| 0| 0| 7.2T/31.5T( 23%)| 8.9G/ 738G( 1%) -------------------+-----+-----+-----+-----+-----------------+----------------- x410_archive | OK | 3.0k| 210k| 213k|21.6T/85.2T( 25%)|26.8G/ 2.2T( 1%)
Lo spazio è sufficientemente pulito. Il processo AutoBalanceLIn può essere annullato poiché sono stati ottenuti i risultati desiderati.