PowerScale: Utilizzo di AutoBalanceLin per spostare rapidamente i dati da un pool di nodi completo

Riepilogo: Questo articolo descrive come utilizzare il processo AutoBalanceLin per liberare rapidamente spazio se un pool a singolo nodo è pieno o quasi al 100% della capacità. Questa procedura deve essere utilizzata solo se sono stati esauriti tutti gli altri metodi per liberare spazio su disco in un pool di nodi. ...

Questo articolo si applica a Questo articolo non si applica a Questo articolo non è legato a un prodotto specifico. Non tutte le versioni del prodotto sono identificate in questo articolo.

Istruzioni

Nota: La procedura seguente richiede la rimozione delle policy del pool di file esistenti e lo striping dei dati su tutti i nodi, indipendentemente dal flusso di lavoro a cui appartengono i dati. Senza le policy del pool di file, non si verifica alcuna gestione dei dati tra i pool o i tier. Assicurarsi di comprendere appieno l'impatto di questa procedura, in quanto potrebbe causare una riduzione delle prestazioni. Eseguire questa operazione è solo come ultimo tentativo dopo aver tentato tutte le altre opzioni per la risoluzione dei problemi di capacità.

È opinione diffusa che AutoBalance e AutoBalanceLin Bilanciare i dati solo all'interno dei pool di nodi e non tra i pool di nodi. Inoltre, si ritiene che solo smartpools/smartpoolstree Può spostare i dati tra due pool di nodi.

I test su OneFS 8.0 e versioni successive dimostrano che questo non è del tutto vero. Se il cluster dispone solo della policy File Pool predefinita di anywhere:anywhere, AutoBalanceLin e AutoBalance Sposta i dati tra più pool di nodi.

Questa operazione deve essere utilizzata solo come soluzione alternativa di emergenza per i cluster che dispongono di un pool di nodi completo. Questo processo sposta rapidamente i dati al di fuori del pool di nodi completo.

Domanda: Quando si desidera utilizzare la seguente procedura?
Risposta: Questa procedura viene utilizzata quando sussistono le seguenti condizioni:
  • Il cluster contiene più pool di nodi e uno o più pool di nodi sono pieni al 100%.
  • Esiste un requisito immediato per liberare spazio su disco in un pool di nodi completo.
  • L'organizzazione esatta dei dati non è un problema immediato.


Procedura:

  1. Prendere nota di ed eliminare tutte le policy del pool di file esistenti, ad eccezione di quella predefinita 'any:any' Policy del pool di file configurata nel cluster.

Prima di procedere con questo passaggio:

  • Registrare la configurazione corrente della policy del pool di file prima di rimuovere le policy. Se il tempo lo consente, si consiglia di raccogliere il registro completo.
  • Per impostazione predefinita, i cluster Isilon sono configurati con la policy del pool di file predefinita impostata per la scrittura dei dati 'anywhere:anywhere'. Prima di procedere, verificare che la policy del pool di file predefinita sia stata ripristinata a queste impostazioni predefinite.
Esempio: Default File Pool Policy. Osservare che le destinazioni di storage sono impostate su "anywhere'.
# isi filepool default-policy view
          Set Requested Protection: default
               Data Access Pattern: concurrency
                  Enable Coalescer: Yes
                    Enable Packing: No
               Data Storage Target: anywhere
                 Data SSD Strategy: metadata
           Snapshot Storage Target: anywhere
             Snapshot SSD Strategy: metadata
                        Cloud Pool: -
         Cloud Compression Enabled: -
          Cloud Encryption Enabled: -
              Cloud Data Retention: -
Cloud Incremental Backup Retention: -
       Cloud Full Backup Retention: -
               Cloud Accessibility: -
                  Cloud Read Ahead: -
            Cloud Cache Expiration: -
         Cloud Writeback Frequency: -
      Cloud Archive Snapshot Files: -
                                ID: -
  1. Eseguire un SmartPools Job per applicare le nuove indicazioni di directory:
# isi job start smartpools -p 1 --policy medium
 
Nota: Aspettatevi il Smartpools lavoro da completare più velocemente del solito con solo il anywhere:anywhere Policy del pool di file predefinita applicata.
 
Nota: A causa di una nuova progettazione nelle versioni successive di OneFS, è possibile che si verifichi il seguente errore quando si tenta di eseguire SmartPools Lavoro a causa di un pool di nodi troppo pieno:
# isi job jobs start SmartPools

Job operation failed: Job 'SmartPools' cannot start because the cluster's free disk space percentage is below 2 (isi_gconfig -t job-config core.free_blocks_pct_threshold_lo threshold) and this job does not free disk space. Free up some space (e.g. run TreeDelete, SnapshotDelete) then try again.: No space left on device

Se NON VEDI il messaggio di errore sopra, vai al passaggio 3 di seguito.

Se VEDI questo messaggio di errore, procedi con il passaggio 2a di seguito.

  1. Controllare nuovamente per verificare se sono presenti dati che è possibile eliminare per liberare spazio nel pool di nodi full. Ciò include il controllo di eventuali istantanee di grandi dimensioni e anche il controllo di eventuali file di sistema o di audit di grandi dimensioni con i seguenti comandi:
Isilon-28# du -sh /ifs/.ifsvar/audit/logs
 
Islon-28# du -sh /ifs/.ifsvar

Se è possibile eliminare una quantità sufficiente di dati, provare a eseguire il comando SmartPools di nuovo lavoro.

Se non sono presenti dati da eliminare, la fase di mitigazione consigliata è la seguente:

  1. Modificare la policy del pool di file predefinita, sopra, per scrivere nel pool di nodi meno pieno. 
  2. Identificare un percorso dati nel pool di nodi completo che include la maggior parte dei dati.
  3. In una sessione dello schermo, eseguire:   
# isi filepool apply -r <data path>   to manually move data under a certain path

i.e.

# isi filepool apply -r /ifs/data/win_data/test_data

verify the job is running:

# ps auwx | grep apply
root   45237   98.1  0.0 102268  61176  0  R+   13:34          0:35.04 /usr/libexec/isilon/isi /usr/bin/isi filepool apply -r /ifs/
  1. Monitorare la capacità. Una volta che il pool di nodi completo è inferiore al 96%, ricominciare tutto da capo con il passaggio due, precedente.
  1. Eseguire un AutoBalanceLin lavoro per alcune ore e monitorare lo spazio. (A differenza di AutoBalance, che esegue un percorso completo dell'albero prima di spostare i dati, AutoBalanceLin Restriping immediato dei dati)
# isi job start autobalancelin -p 1 --policy medium

Quasi immediatamente, osservare che i dati si spostano tra i pool di nodi e il pool di nodi completo dovrebbe liberarsi spazio su disco.
 
Nota: Per questo passaggio, AutoBalanceLin non deve essere eseguito fino al completamento. Monitorare il AutoBalanceLin fino a quando non viene raggiunto l'obiettivo di pulizia del pool di nodi completo, quindi annullare il processo. Ad esempio, è possibile annullare il processo una volta che il pool di nodi completi è sceso all'85% della capacità.
 
Nota: Monitorare l'utilizzo del cluster e verificare che gli altri lavori vengano annullati o sospesi se lo spazio viene influenzato negativamente.

Continuare a monitorare lo spazio ogni ora circa fino a quando lo spazio non raggiunge un livello sufficiente utilizzando il seguente comando:
# isi stat -p -v
 
Nota: Anche in questo caso, non è consigliabile lasciare che AutoBalanceLin Esecuzione fino al completamento. A un certo punto, il lavoro potrebbe spostare i dati in una nuova direzione e potrebbe iniziare a produrre risultati indesiderati. Ad esempio, inverte lo spostamento dei dati, portando eventualmente l'altro pool di nodi a raggiungere la piena capacità mentre il pool precedente si svuota. Esegui solo AutobalanceLIN per alcune ore, o fino a quando lo spazio non viene ripulito, quindi annulla una volta raggiunto l'obiettivo.

Una volta che il cluster ha ottenuto lo sgravio nello spazio sul pool di nodi full, annullare il AutoBalanceLin Lavoro:
# isi job cancel autobalancelin
 
Nota: per ottenere risultati ottimali, i livelli di protezione tra i pool di nodi devono avere lo stesso valore. 

Informazioni aggiuntive

Risultati dei test di laboratorio:

Due pool di nodi, uguali livelli
di protezione Ciò avviene prima:

Node Pool Name: x410_archive          Protection:        +2d:1n
Pool Storage:     HDD                 SSD Storage
Size:             85.2T (94.6T Raw)   2.2T (2.2T Raw)
VHS Size:         9.4T
Used:             29.9T (35%)         35.2G (2%)
Avail:            55.3T (65%)         2.1T (98%)

                           Throughput (bps)  HDD Storage      SSD Storage
Name               Health|  In   Out  Total| Used / Size     |Used / Size
-------------------+-----+-----+-----+-----+-----------------+-----------------
  5|10.5.80.190    | OK  |881.6|    0|881.6|10.0T/31.5T( 32%)|11.7G/ 738G(  2%)
  6|10.5.80.191    |-A-- |    0|    0|    0|10.0T/31.5T( 32%)|11.7G/ 738G(  2%)
  7|10.5.80.192    | OK  |    0|    0|    0|10.0T/31.5T( 32%)|11.7G/ 738G(  2%)
-------------------+-----+-----+-----+-----+-----------------+-----------------
x410_archive       |  OK |110.2|    0|110.2|29.9T/85.2T( 35%)|35.2G/ 2.2T(  2%)

Node Pool Name: x410_35tb_800gb-ssd_64gbProtection:        +2d:1n
Pool Storage:     HDD                 SSD Storage
Size:             112.8T (125.3T Raw) 2.9T (2.9T Raw)
VHS Size:         12.5T
Used:             5.6T (5%)           7.9G (< 1%)
Avail:            107.2T (95%)        2.9T (> 99%)

                           Throughput (bps)  HDD Storage      SSD Storage
Name               Health|  In   Out  Total| Used / Size     |Used / Size
-------------------+-----+-----+-----+-----+-----------------+-----------------
  1|10.5.80.186    | OK  | 2.9M|82.8M|85.6M| 1.4T/31.5T(  4%)| 2.0G/ 738G(< 1%)
  2|10.5.80.187    |-A-- | 104k|38.8k| 143k| 1.4T/30.6T(  5%)| 1.9G/ 738G(< 1%)
  3|10.5.80.188    | OK  |881.6|    0|881.6| 1.4T/31.5T(  4%)| 2.0G/ 738G(< 1%)
  4|10.5.80.189    | OK  |    0|25.8k|25.8k| 1.4T/31.5T(  4%)| 2.0G/ 738G(< 1%)
-------------------+-----+-----+-----+-----+-----------------+-----------------
x410_35tb_800gb-ssd|-M---| 371k|10.4M|10.7M| 5.6T/112.8T(  5%)| 7.9G/ 2.9T(< 1%)
  _64gb            |     |     |     |     |                 |




X410-2# date
Thu Jun 14 16:53:29 CDT 2018


one filepool policy set to default any:any


X410-2# isi job start autobalancelin -p 1 --policy medium
Started job [7159]


in as little as 30 minutes you will see data shift between the two pools, i.e. our first node pool, below, dropped from 32% full to 29%


X410-2# date
Thu Jun 14 17:24:20 CDT 2018



Node Pool Name: x410_archive          Protection:        +2d:1n
Pool Storage:     HDD                 SSD Storage
Size:             85.2T (94.6T Raw)   2.2T (2.2T Raw)
VHS Size:         9.4T
Used:             27.7T (33%)         34.3G (2%)
Avail:            57.5T (67%)         2.1T (98%)

                           Throughput (bps)  HDD Storage      SSD Storage
Name               Health|  In   Out  Total| Used / Size     |Used / Size
-------------------+-----+-----+-----+-----+-----------------+-----------------
  5|10.5.80.190    | OK  | 1.1k|25.8k|26.9k| 9.2T/31.5T( 29%)|11.4G/ 738G(  2%)
  6|10.5.80.191    |-A-- | 1.1k| 1.2M| 1.2M| 9.2T/31.5T( 29%)|11.4G/ 738G(  2%)
  7|10.5.80.192    | OK  |28.6k| 5.2k|33.7k| 9.2T/31.5T( 29%)|11.4G/ 738G(  2%)
-------------------+-----+-----+-----+-----+-----------------+-----------------
x410_archive       |  OK | 3.8k| 152k| 156k|27.7T/85.2T( 33%)|34.3G/ 2.2T(  2%)

Node Pool Name: x410_35tb_800gb-ssd_64gbProtection:        +2d:1n
Pool Storage:     HDD                 SSD Storage
Size:             112.8T (125.3T Raw) 2.9T (2.9T Raw)
VHS Size:         12.5T
Used:             7.6T (7%)           8.8G (< 1%)
Avail:            105.2T (93%)        2.9T (> 99%)

                           Throughput (bps)  HDD Storage      SSD Storage
Name               Health|  In   Out  Total| Used / Size     |Used / Size
-------------------+-----+-----+-----+-----+-----------------+-----------------
  1|10.5.80.186    | OK  |37.9k| 279k| 316k| 1.9T/31.5T(  6%)| 2.2G/ 738G(< 1%)
  2|10.5.80.187    |-A-- | 1.4M|34.8M|36.2M| 1.9T/30.6T(  6%)| 2.2G/ 738G(< 1%)
  3|10.5.80.188    | OK  | 130k|30.9k| 161k| 1.9T/31.5T(  6%)| 2.2G/ 738G(< 1%)
  4|10.5.80.189    | OK  |    0|    0|    0| 1.9T/31.5T(  6%)| 2.2G/ 738G(< 1%)
-------------------+-----+-----+-----+-----+-----------------+-----------------
x410_35tb_800gb-ssd|-M---| 198k| 4.4M| 4.6M| 7.6T/112.8T(  7%)| 8.8G/ 2.9T(< 1%)
  _64gb            |     |     |     |     |                 |

Continuare a monitorare ogni ora circa fino a quando lo spazio su disco non è a un livello sufficiente.

 
Nota: Non lasciare che AutoBalanceLin Esecuzione fino al completamento. Il lavoro sposta i dati nella direzione opposta, il che può iniziare a produrre risultati indesiderati. Lo spazio su disco utilizzato può essere invertito, portando eventualmente a un pool di nodi quasi pieno. Eseguire il processo solo per poche ore.

Punto di un'ora:
X410-2# date
Thu Jun 14 17:54:30 CDT 2018



Node Pool Name: x410_archive          Protection:        +2d:1n
Pool Storage:     HDD                 SSD Storage
Size:             85.2T (94.6T Raw)   2.2T (2.2T Raw)
VHS Size:         9.4T
Used:             25.2T (30%)         33.9G (2%)
Avail:            60.0T (70%)         2.1T (98%)

                           Throughput (bps)  HDD Storage      SSD Storage
Name               Health|  In   Out  Total| Used / Size     |Used / Size
-------------------+-----+-----+-----+-----+-----------------+-----------------
  5|10.5.80.190    | OK  |881.6|20.6k|21.5k| 8.4T/31.5T( 27%)|11.3G/ 738G(  2%)
  6|10.5.80.191    |-A-- |    0|    0|    0| 8.4T/31.5T( 27%)|11.3G/ 738G(  2%)
  7|10.5.80.192    | OK  | 2.2k| 216k| 218k| 8.4T/31.5T( 27%)|11.3G/ 738G(  2%)
-------------------+-----+-----+-----+-----+-----------------+-----------------
x410_archive       |  OK |385.7|29.5k|29.9k|25.2T/85.2T( 30%)|33.9G/ 2.2T(  2%)


X410-2# date
Thu Jun 14 18:54:43 CDT 2018




Node Pool Name: x410_archive          Protection:        +2d:1n
Pool Storage:     HDD                 SSD Storage
Size:             85.2T (94.6T Raw)   2.2T (2.2T Raw)
VHS Size:         9.4T
Used:             21.6T (25%)         26.8G (1%)
Avail:            63.6T (75%)         2.1T (99%)

                           Throughput (bps)  HDD Storage      SSD Storage
Name               Health|  In   Out  Total| Used / Size     |Used / Size
-------------------+-----+-----+-----+-----+-----------------+-----------------
  5|10.5.80.190    | OK  |22.9k| 1.4M| 1.5M| 7.2T/31.5T( 23%)| 8.9G/ 738G(  1%)
  6|10.5.80.191    |-A-- |881.6| 231k| 232k| 7.2T/31.5T( 23%)| 8.9G/ 738G(  1%)
  7|10.5.80.192    | OK  |    0|    0|    0| 7.2T/31.5T( 23%)| 8.9G/ 738G(  1%)
-------------------+-----+-----+-----+-----+-----------------+-----------------
x410_archive       |  OK | 3.0k| 210k| 213k|21.6T/85.2T( 25%)|26.8G/ 2.2T(  1%)


Lo spazio è sufficientemente pulito. La colonna AutoBalanceLIn Il lavoro può essere annullato poiché sono stati raggiunti i risultati desiderati.

Prodotti interessati

Isilon X400
Proprietà dell'articolo
Numero articolo: 000009283
Tipo di articolo: How To
Ultima modifica: 23 giu 2026
Versione:  9
Trova risposta alle tue domande dagli altri utenti Dell
Support Services
Verifica che il dispositivo sia coperto dai Servizi di supporto.