PowerScale: Utilizzo di AutoBalanceLin per spostare rapidamente i dati da un pool di nodi completo
Riepilogo: Questo articolo descrive come utilizzare il processo AutoBalanceLin per liberare rapidamente spazio se un pool a singolo nodo è pieno o quasi al 100% della capacità. Questa procedura deve essere utilizzata solo se sono stati esauriti tutti gli altri metodi per liberare spazio su disco in un pool di nodi. ...
Istruzioni
È opinione diffusa che
AutoBalance e AutoBalanceLin Bilanciare i dati solo all'interno dei pool di nodi e non tra i pool di nodi. Inoltre, si ritiene che solo smartpools/smartpoolstree Può spostare i dati tra due pool di nodi.
I test su OneFS 8.0 e versioni successive dimostrano che questo non è del tutto vero. Se il cluster dispone solo della policy File Pool predefinita di
anywhere:anywhere, AutoBalanceLin e AutoBalance Sposta i dati tra più pool di nodi.
Questa operazione deve essere utilizzata solo come soluzione alternativa di emergenza per i cluster che dispongono di un pool di nodi completo. Questo processo sposta rapidamente i dati al di fuori del pool di nodi completo.
Domanda: Quando si desidera utilizzare la seguente procedura?
Risposta: Questa procedura viene utilizzata quando sussistono le seguenti condizioni:
- Il cluster contiene più pool di nodi e uno o più pool di nodi sono pieni al 100%.
- Esiste un requisito immediato per liberare spazio su disco in un pool di nodi completo.
- L'organizzazione esatta dei dati non è un problema immediato.
Procedura:
- Prendere nota di ed eliminare tutte le policy del pool di file esistenti, ad eccezione di quella predefinita '
any:any' Policy del pool di file configurata nel cluster.
Prima di procedere con questo passaggio:
- Registrare la configurazione corrente della policy del pool di file prima di rimuovere le policy. Se il tempo lo consente, si consiglia di raccogliere il registro completo.
- Per impostazione predefinita, i cluster Isilon sono configurati con la policy del pool di file predefinita impostata per la scrittura dei dati
'anywhere:anywhere'. Prima di procedere, verificare che la policy del pool di file predefinita sia stata ripristinata a queste impostazioni predefinite.
anywhere'.
# isi filepool default-policy view
Set Requested Protection: default
Data Access Pattern: concurrency
Enable Coalescer: Yes
Enable Packing: No
Data Storage Target: anywhere
Data SSD Strategy: metadata
Snapshot Storage Target: anywhere
Snapshot SSD Strategy: metadata
Cloud Pool: -
Cloud Compression Enabled: -
Cloud Encryption Enabled: -
Cloud Data Retention: -
Cloud Incremental Backup Retention: -
Cloud Full Backup Retention: -
Cloud Accessibility: -
Cloud Read Ahead: -
Cloud Cache Expiration: -
Cloud Writeback Frequency: -
Cloud Archive Snapshot Files: -
ID: -
- Eseguire un
SmartPoolsJob per applicare le nuove indicazioni di directory:
# isi job start smartpools -p 1 --policy medium
Smartpools lavoro da completare più velocemente del solito con solo il anywhere:anywhere Policy del pool di file predefinita applicata.
SmartPools Lavoro a causa di un pool di nodi troppo pieno:
# isi job jobs start SmartPools Job operation failed: Job 'SmartPools' cannot start because the cluster's free disk space percentage is below 2 (isi_gconfig -t job-config core.free_blocks_pct_threshold_lo threshold) and this job does not free disk space. Free up some space (e.g. run TreeDelete, SnapshotDelete) then try again.: No space left on device
Se NON VEDI il messaggio di errore sopra, vai al passaggio 3 di seguito.
Se VEDI questo messaggio di errore, procedi con il passaggio 2a di seguito.
- Controllare nuovamente per verificare se sono presenti dati che è possibile eliminare per liberare spazio nel pool di nodi full. Ciò include il controllo di eventuali istantanee di grandi dimensioni e anche il controllo di eventuali file di sistema o di audit di grandi dimensioni con i seguenti comandi:
Isilon-28# du -sh /ifs/.ifsvar/audit/logs Islon-28# du -sh /ifs/.ifsvar
Se è possibile eliminare una quantità sufficiente di dati, provare a eseguire il comando SmartPools di nuovo lavoro.
Se non sono presenti dati da eliminare, la fase di mitigazione consigliata è la seguente:
- Modificare la policy del pool di file predefinita, sopra, per scrivere nel pool di nodi meno pieno.
- Identificare un percorso dati nel pool di nodi completo che include la maggior parte dei dati.
- In una sessione dello schermo, eseguire:
# isi filepool apply -r <data path> to manually move data under a certain path i.e. # isi filepool apply -r /ifs/data/win_data/test_data verify the job is running: # ps auwx | grep apply root 45237 98.1 0.0 102268 61176 0 R+ 13:34 0:35.04 /usr/libexec/isilon/isi /usr/bin/isi filepool apply -r /ifs/
- Monitorare la capacità. Una volta che il pool di nodi completo è inferiore al 96%, ricominciare tutto da capo con il passaggio due, precedente.
- Eseguire un
AutoBalanceLinlavoro per alcune ore e monitorare lo spazio. (A differenza diAutoBalance, che esegue un percorso completo dell'albero prima di spostare i dati,AutoBalanceLinRestriping immediato dei dati)
# isi job start autobalancelin -p 1 --policy medium
Quasi immediatamente, osservare che i dati si spostano tra i pool di nodi e il pool di nodi completo dovrebbe liberarsi spazio su disco.
AutoBalanceLin non deve essere eseguito fino al completamento. Monitorare il AutoBalanceLin fino a quando non viene raggiunto l'obiettivo di pulizia del pool di nodi completo, quindi annullare il processo. Ad esempio, è possibile annullare il processo una volta che il pool di nodi completi è sceso all'85% della capacità.
Continuare a monitorare lo spazio ogni ora circa fino a quando lo spazio non raggiunge un livello sufficiente utilizzando il seguente comando:
# isi stat -p -v
AutoBalanceLin Esecuzione fino al completamento. A un certo punto, il lavoro potrebbe spostare i dati in una nuova direzione e potrebbe iniziare a produrre risultati indesiderati. Ad esempio, inverte lo spostamento dei dati, portando eventualmente l'altro pool di nodi a raggiungere la piena capacità mentre il pool precedente si svuota. Esegui solo AutobalanceLIN per alcune ore, o fino a quando lo spazio non viene ripulito, quindi annulla una volta raggiunto l'obiettivo.
Una volta che il cluster ha ottenuto lo sgravio nello spazio sul pool di nodi full, annullare il
AutoBalanceLin Lavoro:
# isi job cancel autobalancelin
Informazioni aggiuntive
Risultati dei test di laboratorio:
Due pool di nodi, uguali livelli
di protezione Ciò avviene prima:
Node Pool Name: x410_archive Protection: +2d:1n Pool Storage: HDD SSD Storage Size: 85.2T (94.6T Raw) 2.2T (2.2T Raw) VHS Size: 9.4T Used: 29.9T (35%) 35.2G (2%) Avail: 55.3T (65%) 2.1T (98%) Throughput (bps) HDD Storage SSD Storage Name Health| In Out Total| Used / Size |Used / Size -------------------+-----+-----+-----+-----+-----------------+----------------- 5|10.5.80.190 | OK |881.6| 0|881.6|10.0T/31.5T( 32%)|11.7G/ 738G( 2%) 6|10.5.80.191 |-A-- | 0| 0| 0|10.0T/31.5T( 32%)|11.7G/ 738G( 2%) 7|10.5.80.192 | OK | 0| 0| 0|10.0T/31.5T( 32%)|11.7G/ 738G( 2%) -------------------+-----+-----+-----+-----+-----------------+----------------- x410_archive | OK |110.2| 0|110.2|29.9T/85.2T( 35%)|35.2G/ 2.2T( 2%) Node Pool Name: x410_35tb_800gb-ssd_64gbProtection: +2d:1n Pool Storage: HDD SSD Storage Size: 112.8T (125.3T Raw) 2.9T (2.9T Raw) VHS Size: 12.5T Used: 5.6T (5%) 7.9G (< 1%) Avail: 107.2T (95%) 2.9T (> 99%) Throughput (bps) HDD Storage SSD Storage Name Health| In Out Total| Used / Size |Used / Size -------------------+-----+-----+-----+-----+-----------------+----------------- 1|10.5.80.186 | OK | 2.9M|82.8M|85.6M| 1.4T/31.5T( 4%)| 2.0G/ 738G(< 1%) 2|10.5.80.187 |-A-- | 104k|38.8k| 143k| 1.4T/30.6T( 5%)| 1.9G/ 738G(< 1%) 3|10.5.80.188 | OK |881.6| 0|881.6| 1.4T/31.5T( 4%)| 2.0G/ 738G(< 1%) 4|10.5.80.189 | OK | 0|25.8k|25.8k| 1.4T/31.5T( 4%)| 2.0G/ 738G(< 1%) -------------------+-----+-----+-----+-----+-----------------+----------------- x410_35tb_800gb-ssd|-M---| 371k|10.4M|10.7M| 5.6T/112.8T( 5%)| 7.9G/ 2.9T(< 1%) _64gb | | | | | | X410-2# date Thu Jun 14 16:53:29 CDT 2018 one filepool policy set to default any:any X410-2# isi job start autobalancelin -p 1 --policy medium Started job [7159] in as little as 30 minutes you will see data shift between the two pools, i.e. our first node pool, below, dropped from 32% full to 29% X410-2# date Thu Jun 14 17:24:20 CDT 2018 Node Pool Name: x410_archive Protection: +2d:1n Pool Storage: HDD SSD Storage Size: 85.2T (94.6T Raw) 2.2T (2.2T Raw) VHS Size: 9.4T Used: 27.7T (33%) 34.3G (2%) Avail: 57.5T (67%) 2.1T (98%) Throughput (bps) HDD Storage SSD Storage Name Health| In Out Total| Used / Size |Used / Size -------------------+-----+-----+-----+-----+-----------------+----------------- 5|10.5.80.190 | OK | 1.1k|25.8k|26.9k| 9.2T/31.5T( 29%)|11.4G/ 738G( 2%) 6|10.5.80.191 |-A-- | 1.1k| 1.2M| 1.2M| 9.2T/31.5T( 29%)|11.4G/ 738G( 2%) 7|10.5.80.192 | OK |28.6k| 5.2k|33.7k| 9.2T/31.5T( 29%)|11.4G/ 738G( 2%) -------------------+-----+-----+-----+-----+-----------------+----------------- x410_archive | OK | 3.8k| 152k| 156k|27.7T/85.2T( 33%)|34.3G/ 2.2T( 2%) Node Pool Name: x410_35tb_800gb-ssd_64gbProtection: +2d:1n Pool Storage: HDD SSD Storage Size: 112.8T (125.3T Raw) 2.9T (2.9T Raw) VHS Size: 12.5T Used: 7.6T (7%) 8.8G (< 1%) Avail: 105.2T (93%) 2.9T (> 99%) Throughput (bps) HDD Storage SSD Storage Name Health| In Out Total| Used / Size |Used / Size -------------------+-----+-----+-----+-----+-----------------+----------------- 1|10.5.80.186 | OK |37.9k| 279k| 316k| 1.9T/31.5T( 6%)| 2.2G/ 738G(< 1%) 2|10.5.80.187 |-A-- | 1.4M|34.8M|36.2M| 1.9T/30.6T( 6%)| 2.2G/ 738G(< 1%) 3|10.5.80.188 | OK | 130k|30.9k| 161k| 1.9T/31.5T( 6%)| 2.2G/ 738G(< 1%) 4|10.5.80.189 | OK | 0| 0| 0| 1.9T/31.5T( 6%)| 2.2G/ 738G(< 1%) -------------------+-----+-----+-----+-----+-----------------+----------------- x410_35tb_800gb-ssd|-M---| 198k| 4.4M| 4.6M| 7.6T/112.8T( 7%)| 8.8G/ 2.9T(< 1%) _64gb | | | | | |
Continuare a monitorare ogni ora circa fino a quando lo spazio su disco non è a un livello sufficiente.
AutoBalanceLin Esecuzione fino al completamento. Il lavoro sposta i dati nella direzione opposta, il che può iniziare a produrre risultati indesiderati. Lo spazio su disco utilizzato può essere invertito, portando eventualmente a un pool di nodi quasi pieno. Eseguire il processo solo per poche ore.
Punto di un'ora:
X410-2# date Thu Jun 14 17:54:30 CDT 2018 Node Pool Name: x410_archive Protection: +2d:1n Pool Storage: HDD SSD Storage Size: 85.2T (94.6T Raw) 2.2T (2.2T Raw) VHS Size: 9.4T Used: 25.2T (30%) 33.9G (2%) Avail: 60.0T (70%) 2.1T (98%) Throughput (bps) HDD Storage SSD Storage Name Health| In Out Total| Used / Size |Used / Size -------------------+-----+-----+-----+-----+-----------------+----------------- 5|10.5.80.190 | OK |881.6|20.6k|21.5k| 8.4T/31.5T( 27%)|11.3G/ 738G( 2%) 6|10.5.80.191 |-A-- | 0| 0| 0| 8.4T/31.5T( 27%)|11.3G/ 738G( 2%) 7|10.5.80.192 | OK | 2.2k| 216k| 218k| 8.4T/31.5T( 27%)|11.3G/ 738G( 2%) -------------------+-----+-----+-----+-----+-----------------+----------------- x410_archive | OK |385.7|29.5k|29.9k|25.2T/85.2T( 30%)|33.9G/ 2.2T( 2%) X410-2# date Thu Jun 14 18:54:43 CDT 2018 Node Pool Name: x410_archive Protection: +2d:1n Pool Storage: HDD SSD Storage Size: 85.2T (94.6T Raw) 2.2T (2.2T Raw) VHS Size: 9.4T Used: 21.6T (25%) 26.8G (1%) Avail: 63.6T (75%) 2.1T (99%) Throughput (bps) HDD Storage SSD Storage Name Health| In Out Total| Used / Size |Used / Size -------------------+-----+-----+-----+-----+-----------------+----------------- 5|10.5.80.190 | OK |22.9k| 1.4M| 1.5M| 7.2T/31.5T( 23%)| 8.9G/ 738G( 1%) 6|10.5.80.191 |-A-- |881.6| 231k| 232k| 7.2T/31.5T( 23%)| 8.9G/ 738G( 1%) 7|10.5.80.192 | OK | 0| 0| 0| 7.2T/31.5T( 23%)| 8.9G/ 738G( 1%) -------------------+-----+-----+-----+-----+-----------------+----------------- x410_archive | OK | 3.0k| 210k| 213k|21.6T/85.2T( 25%)|26.8G/ 2.2T( 1%)
Lo spazio è sufficientemente pulito. La colonna AutoBalanceLIn Il lavoro può essere annullato poiché sono stati raggiunti i risultati desiderati.