Código do evento Openshift: 1038NODE0007
Résumé: A previsão é de que o file system fique sem espaço nas próximas 4 horas.
Symptômes
À medida que um file system começa a ficar com pouco espaço, o desempenho do sistema geralmente degrada gradativamente.
Se um file system ficar cheio e ficar sem espaço, os processos que precisam gravar nele não poderão mais fazer isso, o que poderá resultar em perda de dados e instabilidade do sistema.
Cause
A coluna NodeFilesystemSpaceFillingUp O alerta é acionado quando duas condições são atendidas:
- O uso atual do file system excede um determinado limite.
- Um algoritmo de extrapolação prevê que o file system ficará sem espaço dentro de um determinado período de tempo. Se o período for inferior a 24 horas, este será um
WarningAlerta. Se o tempo for inferior a 4 horas, este é umCriticalAlerta.
Résolution
Diagnóstico
-
Estude as tendências recentes de uso do sistema de arquivos em um painel de indicadores. Às vezes, um padrão periódico de gravação e limpeza no file system pode fazer com que o algoritmo de previsão linear acione um alerta falso.
-
Use as ferramentas e utilitários do sistema operacional Linux para investigar quais diretórios estão usando mais espaço no sistema de arquivos. O problema é uma condição irregular, como um processo não conseguir limpar atrás de si mesmo e usar uma grande quantidade de espaço? Ou a questão parece estar relacionada ao crescimento orgânico?
Para ajudar no diagnóstico, observe a seguinte métrica no PromQL (execute a consulta no console da Web do OCP: Observe as métricas → → Executar consultas):
node_filesystem_free_bytes |
Em seguida, verifique o mountpoint Rótulo do alerta.
Mitigação
Se a mountpoint rótulo é /, /sysroot ou /var, remova imagens não utilizadas para resolver o problema:
-
Depure o nó acessando o file system do nó:
$ NODE_NAME =< rótulo da instância do alerta> $ oc -n nó de depuração padrão/$NODE_NAME $ chroot /host
-
Remova imagens penduradas:
$ podman imagens -q -f dangling=true | xargs --no-run-if-empty podman rmi
-
Remover imagens não utilizadas:
$ podman imagens | grep -v -e registry.redhat.io -e "quay.io/openshift" -e registry.access.redhat.com -e docker-registry.usersys.redhat.com -e docker-registry.ops.rhcloud.com -e rhmap | xargs --no-run-if-empty podman rmi 2>/dev/null
-
Sair da depuração:
saída de $ saída de $
Serviço de suporte
Se todas as etapas acima não puderem resolver o problema, entre em contato com o suporte técnico da Dell EMC para investigar mais.