PowerScale: Usando o AutoBalanceLin para mover rapidamente os dados de um pool de nós completo
Resumo: Este artigo descreve como usar o trabalho AutoBalanceLin para liberar espaço rapidamente se um pool de único nó estiver cheio ou quase em 100% da capacidade. Esse procedimento só deve ser usado se todos os outros métodos de liberação de espaço em disco em um pool de nós tiverem sido esgotados. ...
Este artigo aplica-se a
Este artigo não se aplica a
Este artigo não está vinculado a nenhum produto específico.
Nem todas as versões do produto estão identificadas neste artigo.
Instruções
Nota: O procedimento a seguir exige a remoção das políticas existentes de pools de arquivos e o fracionamento de dados em todos os nós, independentemente do fluxo de trabalho ao qual os dados pertencem. Sem as políticas de pools de arquivos, não ocorre o gerenciamento de dados entre os pools ou níveis. Certifique-se de que o impacto desse procedimento seja totalmente compreendido, pois pode levar à degradação do desempenho. Isso somente será executado como um último esforço depois que todas as outras opções para resolver problemas de capacidade tiverem sido tentadas.
Acredita-se que
Testes no OneFS 8.0 e versões posteriores comprovam que isso não é totalmente verdade. Se o cluster tiver apenas a política padrão de Pool de arquivos
Isso só deve ser usado como uma solução temporária de emergência para clusters que têm um pool de nós completo. Esse processo move os dados rapidamente para fora do pool completo de nós.
Pergunta: Quando é recomendável usar o procedimento a seguir?
Resposta: Esse procedimento será usado quando as seguintes condições existirem:
Acredita-se que
AutoBalance e AutoBalanceLin Equilibre apenas os dados dentro dos pools de nós, e não entre pools de nós. Além disso, acredita-se apenas smartpools/smartpoolstree Pode mover dados entre dois pools de nós.
Testes no OneFS 8.0 e versões posteriores comprovam que isso não é totalmente verdade. Se o cluster tiver apenas a política padrão de Pool de arquivos
anywhere:anywhere, AutoBalanceLin e AutoBalance Move dados entre vários pools de nós.
Isso só deve ser usado como uma solução temporária de emergência para clusters que têm um pool de nós completo. Esse processo move os dados rapidamente para fora do pool completo de nós.
Pergunta: Quando é recomendável usar o procedimento a seguir?
Resposta: Esse procedimento será usado quando as seguintes condições existirem:
- O cluster contém vários pools de nós, e um ou mais dos pools de nós estão 100% cheios.
- Há um requisito imediato para liberar espaço em disco em um pool de nós completo.
- A organização exata dos dados não é uma preocupação imediata.
Etapas:
- Anote e, em seguida, exclua todas as políticas existentes de pools de arquivos, exceto a padrão '
any:anyPolítica de pool de arquivos do ' configurada no cluster.
Antes de prosseguir com esta etapa:
- Registre a configuração atual da política de pool de arquivos antes de remover as políticas. Se o tempo permitir, recomenda-se uma coleta completa de logs.
- Por padrão, os clusters do Isilon são configurados com a política de pool de arquivos padrão definida para gravar dados no
'anywhere:anywhere'. Antes de continuar, verifique se a política de pool de arquivos padrão foi revertida para essas configurações padrão.
Exemplo: Política padrão de pools de arquivos. Observe que os destinos de armazenamento estão definidos como '
anywhere'.
# isi filepool default-policy view
Set Requested Protection: default
Data Access Pattern: concurrency
Enable Coalescer: Yes
Enable Packing: No
Data Storage Target: anywhere
Data SSD Strategy: metadata
Snapshot Storage Target: anywhere
Snapshot SSD Strategy: metadata
Cloud Pool: -
Cloud Compression Enabled: -
Cloud Encryption Enabled: -
Cloud Data Retention: -
Cloud Incremental Backup Retention: -
Cloud Full Backup Retention: -
Cloud Accessibility: -
Cloud Read Ahead: -
Cloud Cache Expiration: -
Cloud Writeback Frequency: -
Cloud Archive Snapshot Files: -
ID: -
- Execute um
SmartPoolsTrabalho para aplicar novas marcações de diretório:
# isi job start smartpools -p 1 --policy medium
Nota: Espere o
Smartpools Trabalho a ser concluído mais rápido do que o normal apenas com o anywhere:anywhere Política padrão de pools de arquivos em vigor.
Nota: Devido a um novo design em versões posteriores do OneFS, o seguinte erro pode ocorrer quando você tenta executar o
SmartPools Trabalho devido ao pool de nós estar muito cheio:
# isi job jobs start SmartPools Job operation failed: Job 'SmartPools' cannot start because the cluster's free disk space percentage is below 2 (isi_gconfig -t job-config core.free_blocks_pct_threshold_lo threshold) and this job does not free disk space. Free up some space (e.g. run TreeDelete, SnapshotDelete) then try again.: No space left on device
Se você NÃO vir a mensagem de erro acima, vá para a Etapa 3 abaixo.
Se você vir essa mensagem de erro, prossiga com a etapa 2a abaixo.
- Verifique novamente se há dados que você pode excluir para liberar espaço no pool de nós completo. Isso inclui a verificação de snapshots grandes e também de arquivos grandes de sistema ou auditoria com os seguintes comandos:
Isilon-28# du -sh /ifs/.ifsvar/audit/logs Islon-28# du -sh /ifs/.ifsvar
Se você puder excluir dados suficientes, tente executar o comando SmartPools trabalho de novo.
Se não houver absolutamente nenhum dado que possa ser excluído, a etapa de redução recomendada será a seguinte:
- Modifique a política de pools de arquivos padrão, acima, para gravar no pool de nós menos cheio.
- Identifique um caminho de dados no pool de nós completo que inclui a maioria dos dados.
- Em uma sessão de tela, execute:
# isi filepool apply -r <data path> to manually move data under a certain path i.e. # isi filepool apply -r /ifs/data/win_data/test_data verify the job is running: # ps auwx | grep apply root 45237 98.1 0.0 102268 61176 0 R+ 13:34 0:35.04 /usr/libexec/isilon/isi /usr/bin/isi filepool apply -r /ifs/
- Monitore a capacidade. Quando o pool de nós completo estiver abaixo de 96%, comece tudo de novo com a etapa 2, acima.
- Execute um
AutoBalanceLintrabalhe por algumas horas e monitore o espaço. (Ao contrárioAutoBalance, que faz uma caminhada completa antes de mover quaisquer dados,AutoBalanceLinredistribui dados imediatamente)
# isi job start autobalancelin -p 1 --policy medium
Quase imediatamente, observe que os deslocamentos de dados entre os pools de nós e o pool de nós completo devem liberar espaço em disco.
Nota: Para esta etapa,
AutoBalanceLin não precisa ser executado até a conclusão. Monitore o AutoBalanceLin até que o objetivo de limpar o pool de nós completo seja atingido e, em seguida, cancele o trabalho. Por exemplo, você pode cancelar o trabalho quando o pool de nós completo estiver inativo em 85% da capacidade.
Nota: Monitore a utilização do cluster e confirme se outros trabalhos foram cancelados ou pausados se o espaço estiver sendo afetado negativamente.
Continue monitorando o espaço a cada hora ou mais até que o espaço esteja em um nível suficiente usando o seguinte comando:
Continue monitorando o espaço a cada hora ou mais até que o espaço esteja em um nível suficiente usando o seguinte comando:
# isi stat -p -v
Nota: Mais uma vez, não é aconselhável deixar
Depois que o cluster atingir o alívio no espaço no pool completo de nós, cancele o
AutoBalanceLin Execute até a conclusão. Em um certo ponto, o trabalho pode mudar os dados em uma nova direção, e pode começar a produzir resultados indesejáveis. Por exemplo, ele reverte a movimentação de dados, possivelmente levando o outro pool de nós a se aproximar da capacidade total à medida que o pool anterior fica vazio. Executar somente AutobalanceLIN Por algumas horas, ou até que o espaço seja limpo, cancele quando o objetivo for alcançado.
Depois que o cluster atingir o alívio no espaço no pool completo de nós, cancele o
AutoBalanceLin Trabalho:
# isi job cancel autobalancelin
Nota: para obter os resultados ideais, os níveis de proteção entre os pools de nós devem ter o mesmo valor.
Mais informações
Resultados dos testes de laboratório:
Dois pools de nós, níveis
de proteção iguais Isso é antes:
Node Pool Name: x410_archive Protection: +2d:1n Pool Storage: HDD SSD Storage Size: 85.2T (94.6T Raw) 2.2T (2.2T Raw) VHS Size: 9.4T Used: 29.9T (35%) 35.2G (2%) Avail: 55.3T (65%) 2.1T (98%) Throughput (bps) HDD Storage SSD Storage Name Health| In Out Total| Used / Size |Used / Size -------------------+-----+-----+-----+-----+-----------------+----------------- 5|10.5.80.190 | OK |881.6| 0|881.6|10.0T/31.5T( 32%)|11.7G/ 738G( 2%) 6|10.5.80.191 |-A-- | 0| 0| 0|10.0T/31.5T( 32%)|11.7G/ 738G( 2%) 7|10.5.80.192 | OK | 0| 0| 0|10.0T/31.5T( 32%)|11.7G/ 738G( 2%) -------------------+-----+-----+-----+-----+-----------------+----------------- x410_archive | OK |110.2| 0|110.2|29.9T/85.2T( 35%)|35.2G/ 2.2T( 2%) Node Pool Name: x410_35tb_800gb-ssd_64gbProtection: +2d:1n Pool Storage: HDD SSD Storage Size: 112.8T (125.3T Raw) 2.9T (2.9T Raw) VHS Size: 12.5T Used: 5.6T (5%) 7.9G (< 1%) Avail: 107.2T (95%) 2.9T (> 99%) Throughput (bps) HDD Storage SSD Storage Name Health| In Out Total| Used / Size |Used / Size -------------------+-----+-----+-----+-----+-----------------+----------------- 1|10.5.80.186 | OK | 2.9M|82.8M|85.6M| 1.4T/31.5T( 4%)| 2.0G/ 738G(< 1%) 2|10.5.80.187 |-A-- | 104k|38.8k| 143k| 1.4T/30.6T( 5%)| 1.9G/ 738G(< 1%) 3|10.5.80.188 | OK |881.6| 0|881.6| 1.4T/31.5T( 4%)| 2.0G/ 738G(< 1%) 4|10.5.80.189 | OK | 0|25.8k|25.8k| 1.4T/31.5T( 4%)| 2.0G/ 738G(< 1%) -------------------+-----+-----+-----+-----+-----------------+----------------- x410_35tb_800gb-ssd|-M---| 371k|10.4M|10.7M| 5.6T/112.8T( 5%)| 7.9G/ 2.9T(< 1%) _64gb | | | | | | X410-2# date Thu Jun 14 16:53:29 CDT 2018 one filepool policy set to default any:any X410-2# isi job start autobalancelin -p 1 --policy medium Started job [7159] in as little as 30 minutes you will see data shift between the two pools, i.e. our first node pool, below, dropped from 32% full to 29% X410-2# date Thu Jun 14 17:24:20 CDT 2018 Node Pool Name: x410_archive Protection: +2d:1n Pool Storage: HDD SSD Storage Size: 85.2T (94.6T Raw) 2.2T (2.2T Raw) VHS Size: 9.4T Used: 27.7T (33%) 34.3G (2%) Avail: 57.5T (67%) 2.1T (98%) Throughput (bps) HDD Storage SSD Storage Name Health| In Out Total| Used / Size |Used / Size -------------------+-----+-----+-----+-----+-----------------+----------------- 5|10.5.80.190 | OK | 1.1k|25.8k|26.9k| 9.2T/31.5T( 29%)|11.4G/ 738G( 2%) 6|10.5.80.191 |-A-- | 1.1k| 1.2M| 1.2M| 9.2T/31.5T( 29%)|11.4G/ 738G( 2%) 7|10.5.80.192 | OK |28.6k| 5.2k|33.7k| 9.2T/31.5T( 29%)|11.4G/ 738G( 2%) -------------------+-----+-----+-----+-----+-----------------+----------------- x410_archive | OK | 3.8k| 152k| 156k|27.7T/85.2T( 33%)|34.3G/ 2.2T( 2%) Node Pool Name: x410_35tb_800gb-ssd_64gbProtection: +2d:1n Pool Storage: HDD SSD Storage Size: 112.8T (125.3T Raw) 2.9T (2.9T Raw) VHS Size: 12.5T Used: 7.6T (7%) 8.8G (< 1%) Avail: 105.2T (93%) 2.9T (> 99%) Throughput (bps) HDD Storage SSD Storage Name Health| In Out Total| Used / Size |Used / Size -------------------+-----+-----+-----+-----+-----------------+----------------- 1|10.5.80.186 | OK |37.9k| 279k| 316k| 1.9T/31.5T( 6%)| 2.2G/ 738G(< 1%) 2|10.5.80.187 |-A-- | 1.4M|34.8M|36.2M| 1.9T/30.6T( 6%)| 2.2G/ 738G(< 1%) 3|10.5.80.188 | OK | 130k|30.9k| 161k| 1.9T/31.5T( 6%)| 2.2G/ 738G(< 1%) 4|10.5.80.189 | OK | 0| 0| 0| 1.9T/31.5T( 6%)| 2.2G/ 738G(< 1%) -------------------+-----+-----+-----+-----+-----------------+----------------- x410_35tb_800gb-ssd|-M---| 198k| 4.4M| 4.6M| 7.6T/112.8T( 7%)| 8.8G/ 2.9T(< 1%) _64gb | | | | | |
Continue monitorando a cada hora ou mais até que o espaço em disco esteja em um nível suficiente.
Nota: Não deixe
AutoBalanceLin Execute até a conclusão. O trabalho desloca os dados na direção oposta, o que pode começar a produzir resultados indesejáveis. O espaço em disco consumido pode se inverter, possivelmente levando a um pool de nós quase cheio novamente. Execute o trabalho apenas por algumas horas.
Ponto de uma hora:
X410-2# date Thu Jun 14 17:54:30 CDT 2018 Node Pool Name: x410_archive Protection: +2d:1n Pool Storage: HDD SSD Storage Size: 85.2T (94.6T Raw) 2.2T (2.2T Raw) VHS Size: 9.4T Used: 25.2T (30%) 33.9G (2%) Avail: 60.0T (70%) 2.1T (98%) Throughput (bps) HDD Storage SSD Storage Name Health| In Out Total| Used / Size |Used / Size -------------------+-----+-----+-----+-----+-----------------+----------------- 5|10.5.80.190 | OK |881.6|20.6k|21.5k| 8.4T/31.5T( 27%)|11.3G/ 738G( 2%) 6|10.5.80.191 |-A-- | 0| 0| 0| 8.4T/31.5T( 27%)|11.3G/ 738G( 2%) 7|10.5.80.192 | OK | 2.2k| 216k| 218k| 8.4T/31.5T( 27%)|11.3G/ 738G( 2%) -------------------+-----+-----+-----+-----+-----------------+----------------- x410_archive | OK |385.7|29.5k|29.9k|25.2T/85.2T( 30%)|33.9G/ 2.2T( 2%) X410-2# date Thu Jun 14 18:54:43 CDT 2018 Node Pool Name: x410_archive Protection: +2d:1n Pool Storage: HDD SSD Storage Size: 85.2T (94.6T Raw) 2.2T (2.2T Raw) VHS Size: 9.4T Used: 21.6T (25%) 26.8G (1%) Avail: 63.6T (75%) 2.1T (99%) Throughput (bps) HDD Storage SSD Storage Name Health| In Out Total| Used / Size |Used / Size -------------------+-----+-----+-----+-----+-----------------+----------------- 5|10.5.80.190 | OK |22.9k| 1.4M| 1.5M| 7.2T/31.5T( 23%)| 8.9G/ 738G( 1%) 6|10.5.80.191 |-A-- |881.6| 231k| 232k| 7.2T/31.5T( 23%)| 8.9G/ 738G( 1%) 7|10.5.80.192 | OK | 0| 0| 0| 7.2T/31.5T( 23%)| 8.9G/ 738G( 1%) -------------------+-----+-----+-----+-----+-----------------+----------------- x410_archive | OK | 3.0k| 210k| 213k|21.6T/85.2T( 25%)|26.8G/ 2.2T( 1%)
O espaço está suficientemente limpo. A coluna AutoBalanceLIn O trabalho pode ser cancelado desde que os resultados desejados tenham sido alcançados.
Produtos afetados
Isilon X400Propriedades do artigo
Número do artigo: 000009283
Tipo de artigo: How To
Último modificado: 23 jun. 2026
Versão: 9
Encontre as respostas de outros usuários da Dell para suas perguntas.
Serviços de suporte
Verifique se o dispositivo está coberto pelos serviços de suporte.