PowerScale: Problemas NANON do CloudPools
Resumo: O CloudPools exige que cada nó do cluster seja capaz de se conectar ao CloudPools para funcionar corretamente. Problemas intermitentes podem ser vistos quando até mesmo um único nó não consegue acessar o CloudPools. ...
Sintomas
Sintomas que indicam uma possível situação em que nem todos os nós podem se conectar ao provedor de serviços em nuvem ou ao bucket de nuvem:
- Se um nó não fizer parte de um pool de rede, serão exibidos erros ao recuperar arquivos. Isso pode ser intermitente ou aparentemente aleatório.
- Se um nó fizer parte de um cluster de destino do SyncIQ (SIQ), ocorrerão erros de E/S que causarão falha nos trabalhos. Você pode ver trabalhos bem-sucedidos ou trabalhos com apenas algumas políticas problemáticas, mas isso não prova que a configuração funciona ou que as falhas não ocorreram.
- Você pode ver atrasos na recuperação de arquivos.
- Você poderá ver falhas aleatórias na recuperação de arquivos, e as tentativas subsequentes de recuperação serão bem-sucedidas.
Causa
O CloudPools exige que cada nó tenha uma conexão de rede externa capaz de transmitir dados entre o PowerScale e o dispositivo provedor de nuvem.
O CloudPools usa o pool de rede com a prioridade mais baixa que pode se conectar. Se não for possível estabelecer conexão, ele move a lista de pools de rede para baixo até encontrar um que seja bem-sucedido ou exibir um erro de que não pode se conectar.
Todos os nós participam da atividade do CloudPools. Isso é projetado para recuperar ou descarregar dados o mais rápido possível.
Não há como alterar esse comportamento.
Resolução
Embora você possa tentar uma abordagem com martelo, como reiniciar o trabalho do SyncIQ sempre que ele falhar, essa não é uma solução de longo prazo.
A única solução é verificar se cada nó pode se conectar ao seu bucket de nuvem.