PowerScale: Usando o AutoBalanceLin para mover rapidamente os dados de um pool de nós completo

Resumo: Este artigo descreve como usar o trabalho AutoBalanceLin para liberar espaço rapidamente se um pool de único nó estiver cheio ou quase em 100% da capacidade. Esse procedimento só deve ser usado se todos os outros métodos de liberação de espaço em disco em um pool de nós tiverem sido esgotados. ...

Produtos afetados

Este artigo aplica-se a Este artigo não se aplica a Este artigo não está vinculado a nenhum produto específico. Nem todas as versões do produto estão identificadas neste artigo.

Confira outros recursos

Instruções

Nota: O procedimento a seguir exige a remoção das políticas existentes de pools de arquivos e o fracionamento de dados em todos os nós, independentemente do fluxo de trabalho ao qual os dados pertencem. Sem as políticas de pools de arquivos, não ocorre o gerenciamento de dados entre os pools ou níveis. Certifique-se de que o impacto desse procedimento seja totalmente compreendido, pois pode levar à degradação do desempenho. Isso somente será executado como um último esforço depois que todas as outras opções para resolver problemas de capacidade tiverem sido tentadas.

Acredita-se que AutoBalance e AutoBalanceLin Equilibre apenas os dados dentro dos pools de nós, e não entre pools de nós. Além disso, acredita-se apenas smartpools/smartpoolstree Pode mover dados entre dois pools de nós.

Testes no OneFS 8.0 e versões posteriores comprovam que isso não é totalmente verdade. Se o cluster tiver apenas a política padrão de Pool de arquivos anywhere:anywhere, AutoBalanceLin e AutoBalance Move dados entre vários pools de nós.

Isso só deve ser usado como uma solução temporária de emergência para clusters que têm um pool de nós completo. Esse processo move os dados rapidamente para fora do pool completo de nós.

Pergunta: Quando é recomendável usar o procedimento a seguir?
Resposta: Esse procedimento será usado quando as seguintes condições existirem:

O cluster contém vários pools de nós, e um ou mais dos pools de nós estão 100% cheios.
Há um requisito imediato para liberar espaço em disco em um pool de nós completo.
A organização exata dos dados não é uma preocupação imediata.

Etapas:

Anote e, em seguida, exclua todas as políticas existentes de pools de arquivos, exceto a padrão 'any:anyPolítica de pool de arquivos do ' configurada no cluster.

Antes de prosseguir com esta etapa:

Registre a configuração atual da política de pool de arquivos antes de remover as políticas. Se o tempo permitir, recomenda-se uma coleta completa de logs.
Por padrão, os clusters do Isilon são configurados com a política de pool de arquivos padrão definida para gravar dados no 'anywhere:anywhere'. Antes de continuar, verifique se a política de pool de arquivos padrão foi revertida para essas configurações padrão.

Exemplo: Política padrão de pools de arquivos. Observe que os destinos de armazenamento estão definidos como 'anywhere'.

# isi filepool default-policy view
          Set Requested Protection: default
               Data Access Pattern: concurrency
                  Enable Coalescer: Yes
                    Enable Packing: No
               Data Storage Target: anywhere
                 Data SSD Strategy: metadata
           Snapshot Storage Target: anywhere
             Snapshot SSD Strategy: metadata
                        Cloud Pool: -
         Cloud Compression Enabled: -
          Cloud Encryption Enabled: -
              Cloud Data Retention: -
Cloud Incremental Backup Retention: -
       Cloud Full Backup Retention: -
               Cloud Accessibility: -
                  Cloud Read Ahead: -
            Cloud Cache Expiration: -
         Cloud Writeback Frequency: -
      Cloud Archive Snapshot Files: -
                                ID: -

Execute um SmartPools Trabalho para aplicar novas marcações de diretório:

# isi job start smartpools -p 1 --policy medium

Nota: Espere o Smartpools Trabalho a ser concluído mais rápido do que o normal apenas com o anywhere:anywhere Política padrão de pools de arquivos em vigor.

Nota: Devido a um novo design em versões posteriores do OneFS, o seguinte erro pode ocorrer quando você tenta executar o SmartPools Trabalho devido ao pool de nós estar muito cheio:

# isi job jobs start SmartPools

Job operation failed: Job 'SmartPools' cannot start because the cluster's free disk space percentage is below 2 (isi_gconfig -t job-config core.free_blocks_pct_threshold_lo threshold) and this job does not free disk space. Free up some space (e.g. run TreeDelete, SnapshotDelete) then try again.: No space left on device

Se você NÃO vir a mensagem de erro acima, vá para a Etapa 3 abaixo.

Se você vir essa mensagem de erro, prossiga com a etapa 2a abaixo.

Verifique novamente se há dados que você pode excluir para liberar espaço no pool de nós completo. Isso inclui a verificação de snapshots grandes e também de arquivos grandes de sistema ou auditoria com os seguintes comandos:

Isilon-28# du -sh /ifs/.ifsvar/audit/logs
 
Islon-28# du -sh /ifs/.ifsvar

Se você puder excluir dados suficientes, tente executar o comando SmartPools trabalho de novo.

Se não houver absolutamente nenhum dado que possa ser excluído, a etapa de redução recomendada será a seguinte:

Modifique a política de pools de arquivos padrão, acima, para gravar no pool de nós menos cheio.
Identifique um caminho de dados no pool de nós completo que inclui a maioria dos dados.
Em uma sessão de tela, execute:

# isi filepool apply -r <data path>   to manually move data under a certain path

i.e.

# isi filepool apply -r /ifs/data/win_data/test_data

verify the job is running:

# ps auwx | grep apply
root   45237   98.1  0.0 102268  61176  0  R+   13:34          0:35.04 /usr/libexec/isilon/isi /usr/bin/isi filepool apply -r /ifs/

Monitore a capacidade. Quando o pool de nós completo estiver abaixo de 96%, comece tudo de novo com a etapa 2, acima.

Execute um AutoBalanceLin trabalhe por algumas horas e monitore o espaço. (Ao contrário AutoBalance, que faz uma caminhada completa antes de mover quaisquer dados, AutoBalanceLin redistribui dados imediatamente)

# isi job start autobalancelin -p 1 --policy medium

Quase imediatamente, observe que os deslocamentos de dados entre os pools de nós e o pool de nós completo devem liberar espaço em disco.

Nota: Para esta etapa, AutoBalanceLin não precisa ser executado até a conclusão. Monitore o AutoBalanceLin até que o objetivo de limpar o pool de nós completo seja atingido e, em seguida, cancele o trabalho. Por exemplo, você pode cancelar o trabalho quando o pool de nós completo estiver inativo em 85% da capacidade.

Nota: Monitore a utilização do cluster e confirme se outros trabalhos foram cancelados ou pausados se o espaço estiver sendo afetado negativamente.

Continue monitorando o espaço a cada hora ou mais até que o espaço esteja em um nível suficiente usando o seguinte comando:

# isi stat -p -v

Nota: Mais uma vez, não é aconselhável deixar AutoBalanceLin Execute até a conclusão. Em um certo ponto, o trabalho pode mudar os dados em uma nova direção, e pode começar a produzir resultados indesejáveis. Por exemplo, ele reverte a movimentação de dados, possivelmente levando o outro pool de nós a se aproximar da capacidade total à medida que o pool anterior fica vazio. Executar somente AutobalanceLIN Por algumas horas, ou até que o espaço seja limpo, cancele quando o objetivo for alcançado.

Depois que o cluster atingir o alívio no espaço no pool completo de nós, cancele o AutoBalanceLin Trabalho:

# isi job cancel autobalancelin

Nota: para obter os resultados ideais, os níveis de proteção entre os pools de nós devem ter o mesmo valor.

Mais informações

Resultados dos testes de laboratório:

Dois pools de nós, níveis
de proteção iguais Isso é antes:

Node Pool Name: x410_archive          Protection:        +2d:1n
Pool Storage:     HDD                 SSD Storage
Size:             85.2T (94.6T Raw)   2.2T (2.2T Raw)
VHS Size:         9.4T
Used:             29.9T (35%)         35.2G (2%)
Avail:            55.3T (65%)         2.1T (98%)

                           Throughput (bps)  HDD Storage      SSD Storage
Name               Health|  In   Out  Total| Used / Size     |Used / Size
-------------------+-----+-----+-----+-----+-----------------+-----------------
  5|10.5.80.190    | OK  |881.6|    0|881.6|10.0T/31.5T( 32%)|11.7G/ 738G(  2%)
  6|10.5.80.191    |-A-- |    0|    0|    0|10.0T/31.5T( 32%)|11.7G/ 738G(  2%)
  7|10.5.80.192    | OK  |    0|    0|    0|10.0T/31.5T( 32%)|11.7G/ 738G(  2%)
-------------------+-----+-----+-----+-----+-----------------+-----------------
x410_archive       |  OK |110.2|    0|110.2|29.9T/85.2T( 35%)|35.2G/ 2.2T(  2%)

Node Pool Name: x410_35tb_800gb-ssd_64gbProtection:        +2d:1n
Pool Storage:     HDD                 SSD Storage
Size:             112.8T (125.3T Raw) 2.9T (2.9T Raw)
VHS Size:         12.5T
Used:             5.6T (5%)           7.9G (< 1%)
Avail:            107.2T (95%)        2.9T (> 99%)

                           Throughput (bps)  HDD Storage      SSD Storage
Name               Health|  In   Out  Total| Used / Size     |Used / Size
-------------------+-----+-----+-----+-----+-----------------+-----------------
  1|10.5.80.186    | OK  | 2.9M|82.8M|85.6M| 1.4T/31.5T(  4%)| 2.0G/ 738G(< 1%)
  2|10.5.80.187    |-A-- | 104k|38.8k| 143k| 1.4T/30.6T(  5%)| 1.9G/ 738G(< 1%)
  3|10.5.80.188    | OK  |881.6|    0|881.6| 1.4T/31.5T(  4%)| 2.0G/ 738G(< 1%)
  4|10.5.80.189    | OK  |    0|25.8k|25.8k| 1.4T/31.5T(  4%)| 2.0G/ 738G(< 1%)
-------------------+-----+-----+-----+-----+-----------------+-----------------
x410_35tb_800gb-ssd|-M---| 371k|10.4M|10.7M| 5.6T/112.8T(  5%)| 7.9G/ 2.9T(< 1%)
  _64gb            |     |     |     |     |                 |




X410-2# date
Thu Jun 14 16:53:29 CDT 2018


one filepool policy set to default any:any


X410-2# isi job start autobalancelin -p 1 --policy medium
Started job [7159]


in as little as 30 minutes you will see data shift between the two pools, i.e. our first node pool, below, dropped from 32% full to 29%


X410-2# date
Thu Jun 14 17:24:20 CDT 2018



Node Pool Name: x410_archive          Protection:        +2d:1n
Pool Storage:     HDD                 SSD Storage
Size:             85.2T (94.6T Raw)   2.2T (2.2T Raw)
VHS Size:         9.4T
Used:             27.7T (33%)         34.3G (2%)
Avail:            57.5T (67%)         2.1T (98%)

                           Throughput (bps)  HDD Storage      SSD Storage
Name               Health|  In   Out  Total| Used / Size     |Used / Size
-------------------+-----+-----+-----+-----+-----------------+-----------------
  5|10.5.80.190    | OK  | 1.1k|25.8k|26.9k| 9.2T/31.5T( 29%)|11.4G/ 738G(  2%)
  6|10.5.80.191    |-A-- | 1.1k| 1.2M| 1.2M| 9.2T/31.5T( 29%)|11.4G/ 738G(  2%)
  7|10.5.80.192    | OK  |28.6k| 5.2k|33.7k| 9.2T/31.5T( 29%)|11.4G/ 738G(  2%)
-------------------+-----+-----+-----+-----+-----------------+-----------------
x410_archive       |  OK | 3.8k| 152k| 156k|27.7T/85.2T( 33%)|34.3G/ 2.2T(  2%)

Node Pool Name: x410_35tb_800gb-ssd_64gbProtection:        +2d:1n
Pool Storage:     HDD                 SSD Storage
Size:             112.8T (125.3T Raw) 2.9T (2.9T Raw)
VHS Size:         12.5T
Used:             7.6T (7%)           8.8G (< 1%)
Avail:            105.2T (93%)        2.9T (> 99%)

                           Throughput (bps)  HDD Storage      SSD Storage
Name               Health|  In   Out  Total| Used / Size     |Used / Size
-------------------+-----+-----+-----+-----+-----------------+-----------------
  1|10.5.80.186    | OK  |37.9k| 279k| 316k| 1.9T/31.5T(  6%)| 2.2G/ 738G(< 1%)
  2|10.5.80.187    |-A-- | 1.4M|34.8M|36.2M| 1.9T/30.6T(  6%)| 2.2G/ 738G(< 1%)
  3|10.5.80.188    | OK  | 130k|30.9k| 161k| 1.9T/31.5T(  6%)| 2.2G/ 738G(< 1%)
  4|10.5.80.189    | OK  |    0|    0|    0| 1.9T/31.5T(  6%)| 2.2G/ 738G(< 1%)
-------------------+-----+-----+-----+-----+-----------------+-----------------
x410_35tb_800gb-ssd|-M---| 198k| 4.4M| 4.6M| 7.6T/112.8T(  7%)| 8.8G/ 2.9T(< 1%)
  _64gb            |     |     |     |     |                 |

Continue monitorando a cada hora ou mais até que o espaço em disco esteja em um nível suficiente.

Nota: Não deixe AutoBalanceLin Execute até a conclusão. O trabalho desloca os dados na direção oposta, o que pode começar a produzir resultados indesejáveis. O espaço em disco consumido pode se inverter, possivelmente levando a um pool de nós quase cheio novamente. Execute o trabalho apenas por algumas horas.

Ponto de uma hora:

X410-2# date
Thu Jun 14 17:54:30 CDT 2018



Node Pool Name: x410_archive          Protection:        +2d:1n
Pool Storage:     HDD                 SSD Storage
Size:             85.2T (94.6T Raw)   2.2T (2.2T Raw)
VHS Size:         9.4T
Used:             25.2T (30%)         33.9G (2%)
Avail:            60.0T (70%)         2.1T (98%)

                           Throughput (bps)  HDD Storage      SSD Storage
Name               Health|  In   Out  Total| Used / Size     |Used / Size
-------------------+-----+-----+-----+-----+-----------------+-----------------
  5|10.5.80.190    | OK  |881.6|20.6k|21.5k| 8.4T/31.5T( 27%)|11.3G/ 738G(  2%)
  6|10.5.80.191    |-A-- |    0|    0|    0| 8.4T/31.5T( 27%)|11.3G/ 738G(  2%)
  7|10.5.80.192    | OK  | 2.2k| 216k| 218k| 8.4T/31.5T( 27%)|11.3G/ 738G(  2%)
-------------------+-----+-----+-----+-----+-----------------+-----------------
x410_archive       |  OK |385.7|29.5k|29.9k|25.2T/85.2T( 30%)|33.9G/ 2.2T(  2%)


X410-2# date
Thu Jun 14 18:54:43 CDT 2018




Node Pool Name: x410_archive          Protection:        +2d:1n
Pool Storage:     HDD                 SSD Storage
Size:             85.2T (94.6T Raw)   2.2T (2.2T Raw)
VHS Size:         9.4T
Used:             21.6T (25%)         26.8G (1%)
Avail:            63.6T (75%)         2.1T (99%)

                           Throughput (bps)  HDD Storage      SSD Storage
Name               Health|  In   Out  Total| Used / Size     |Used / Size
-------------------+-----+-----+-----+-----+-----------------+-----------------
  5|10.5.80.190    | OK  |22.9k| 1.4M| 1.5M| 7.2T/31.5T( 23%)| 8.9G/ 738G(  1%)
  6|10.5.80.191    |-A-- |881.6| 231k| 232k| 7.2T/31.5T( 23%)| 8.9G/ 738G(  1%)
  7|10.5.80.192    | OK  |    0|    0|    0| 7.2T/31.5T( 23%)| 8.9G/ 738G(  1%)
-------------------+-----+-----+-----+-----+-----------------+-----------------
x410_archive       |  OK | 3.0k| 210k| 213k|21.6T/85.2T( 25%)|26.8G/ 2.2T(  1%)

O espaço está suficientemente limpo. A coluna AutoBalanceLIn O trabalho pode ser cancelado desde que os resultados desejados tenham sido alcançados.

Produtos afetados

Isilon X400

Número do artigo: 000009283

Tipo de artigo: How To

Último modificado: 23 jun. 2026

Versão: 9

Verifique se o dispositivo está coberto pelos serviços de suporte.

PowerScale: Usando o AutoBalanceLin para mover rapidamente os dados de um pool de nós completo

Instruções

Informações adicionais

Produtos afetados

Instruções

Etapas:

Mais informações

Produtos afetados

Propriedades do artigo

Encontre as respostas de outros usuários da Dell para suas perguntas.

Serviços de suporte

Propriedades do artigo

Encontre as respostas de outros usuários da Dell para suas perguntas.

Serviços de suporte

PowerScale: Usando o AutoBalanceLin para mover rapidamente os dados de um pool de nós completo

Artigo detalhado

Instruções

Informações adicionais

Produtos afetados

Instruções

Etapas:

Mais informações

Produtos afetados

Propriedades do artigo

Encontre as respostas de outros usuários da Dell para suas perguntas.

Serviços de suporte

Propriedades do artigo

Encontre as respostas de outros usuários da Dell para suas perguntas.

Serviços de suporte