Dell Unity: Pane na controladora de armazenamento durante um evento de pool cheio
Summary: Este artigo explica por que uma controladora de armazenamento entra em pane quando um pool atinge 100% de consumo e fornece opções de correção.
Symptoms
O pool de armazenamento atingiu 100% de capacidade.
Um processo de armazenamento entrou em pane quando um pool ficou cheio e um ou mais file systems (FS) ou números de unidade lógica (LUN) são exibidos como off-line e exigindo recuperação. Todos os snapshots de um ou mais FS ou LUN marcados como off-line também precisam ser recuperados.
Cause
A sequência do pânico:
- O pool fica 100% cheio e o array começa a invalidar os snapshots.
- O array começa a desmontar os snapshots.
- O array tenta atualizar os metadados e o superbloco para alocar
getSlice. Isso falha porque o pool está 100% cheio. - A operação para desmontar os snapshots excede o tempo de espera e causa uma pane da SP.
Resolution
O FS, as LUNs e os snapshots precisam de espaço livre no pool para que uma tentativa de recuperação seja iniciada. Isso é feito expandindo o pool afetado.
Se o pool afetado não puder ser expandido, o espaço livre deverá ser criado no pool por um dos seguintes métodos:
- Excluir snapshots
- Expandir o pool de armazenamento (usando unidades existentes ou comprando unidades adicionais se houver slots disponíveis)
- Remover recursos desnecessários (LUNs ou FSs)
- Execute o procedimento de recuperação de espaço (do lado do host) para potencialmente liberar espaço que não foi zerado no lado do array
- Investigue as preocupações com espaço pré-alocado
Se precisar de mais ajuda, entre em contato com o suporte técnico da Dell e consulte este artigo da base de conhecimento Dell.
Additional Information
Como excluir snapshots desnecessários
Etapa 1: Verifique o uso do pool:
- Unisphere:
- Pools de ARMAZENAMENTO >
- Selecione o pool afetado e analise o
Used (%). - Clique no nome do pool para visualizar o uso detalhado, inclusive o espaço usado pelos snapshots.
- CLI:
- Faça login no putty com credenciais de serviço.
- Comando de execução:
uemcli -d 10.0.0.1 -u Local/joe -p MyPassword456! /stor/config/pool show -detail
Etapa 2: Identifique snapshots grandes ou antigos:
- Unisphere:
- LUNs de bloco > de ARMAZENAMENTO> ou sistemas de arquivos > de ARMAZENAMENTO>
- Para cada LUN ou file system, verifique a guia Snapshots .
- CLI:
- Faça login no putty com credenciais de serviço.
- Execute o comando para ver os detalhes do snapshot:
uemcli -d 10.0.0.1 -u Local/joe -p MyPassword456! /prot/snap show -detail - Execute o comando para ver o espaço de snapshot usado pelo recurso de armazenamento individual:
uemcli -d 10.0.0.1 -u Local/joe -p MyPassword456! /stor/config/pool/sr -pool <pool name> show -detail Example:
uemcli -d 10.0.0.1 -u Local/joe -p MyPassword456! /stor/config/pool/sr -pool pool_1 show -detail
ID = sv_1
Name = AF LUN 1
Resource type = LUN
Pool = pool_1
Total pool space used = 14448566272 (13.4G)
Total pool preallocated = 4610351104 (4.2G)
Total pool snapshot space used = 4593991680 (4.2G)
Total pool non-base space used = 4593991680 (4.2G)
Health state = OK (5)
Health details = "The LUN is operating normally. No action is required."
Etapa 3: Excluir snapshots:
⚠️ Cuidado: Certifique-se de que os snapshots não sejam necessários para backup ou recuperação antes da exclusão. ⚠️
- Unisphere:
- Selecione um ou mais snapshots para excluir.
- Clique em Delete e confirme a ação.
- Repita para outras LUNs ou FSs, conforme necessário.
- CLI:
- Comando de execução:
uemcli -d 10.0.0.1 -u Local/joe -p MyPassword456! /prot/snap –id <Snapshot ID> delete
- Comando de execução:
Etapa 4: Monitorar o uso do pool:
- Unisphere:
- Após a exclusão, retorne a STORAGE > Pools
- Atualize a página e monitore o
Used (%)valor. - Pode levar alguns minutos para que o espaço seja recuperado.
- CLI:
- Comando de execução:
uemcli -d 10.0.0.1 -u Local/joe -p MyPassword456! /stor/config/pool show -detail
- Comando de execução:
Dicas adicionais:
- Automatize a exclusão de snapshots: Defina políticas de retenção para excluir automaticamente snapshots antigos.
- Analise os agendamentos de snapshot: Evite a criação de snapshots muito frequentes.
- Ativar alertas: Configure alertas para limites de uso do pool (por exemplo, 80%, 90%) para agir proativamente.