Código do evento Openshift: 1038NODE0007

Résumé: A previsão é de que o file system fique sem espaço nas próximas 4 horas.

Cet article concerne Cet article ne concerne pas Cet article n’est associé à aucun produit spécifique. Toutes les versions du produit ne sont pas identifiées dans cet article.

Symptômes

À medida que um file system começa a ficar com pouco espaço, o desempenho do sistema geralmente degrada gradativamente.

Se um file system ficar cheio e ficar sem espaço, os processos que precisam gravar nele não poderão mais fazer isso, o que poderá resultar em perda de dados e instabilidade do sistema.

Cause

A coluna NodeFilesystemSpaceFillingUp O alerta é acionado quando duas condições são atendidas:

  • O uso atual do file system excede um determinado limite.
  • Um algoritmo de extrapolação prevê que o file system ficará sem espaço dentro de um determinado período de tempo. Se o período for inferior a 24 horas, este será um Warning Alerta. Se o tempo for inferior a 4 horas, este é um Critical Alerta.

Résolution

Diagnóstico

  • Estude as tendências recentes de uso do sistema de arquivos em um painel de indicadores. Às vezes, um padrão periódico de gravação e limpeza no file system pode fazer com que o algoritmo de previsão linear acione um alerta falso.

  • Use as ferramentas e utilitários do sistema operacional Linux para investigar quais diretórios estão usando mais espaço no sistema de arquivos. O problema é uma condição irregular, como um processo não conseguir limpar atrás de si mesmo e usar uma grande quantidade de espaço? Ou a questão parece estar relacionada ao crescimento orgânico?

Para ajudar no diagnóstico, observe a seguinte métrica no PromQL (execute a consulta no console da Web do OCP: Observe as métricas → → Executar consultas):

node_filesystem_free_bytes

Em seguida, verifique o mountpoint Rótulo do alerta.

Mitigação

Se a mountpoint rótulo é //sysroot ou /var, remova imagens não utilizadas para resolver o problema:

  1. Depure o nó acessando o file system do nó:

    $ NODE_NAME =< rótulo da instância do alerta>
    $ oc -n nó de depuração padrão/$NODE_NAME
    $ chroot /host

     

  2. Remova imagens penduradas:

    $ podman imagens -q -f dangling=true | xargs --no-run-if-empty podman rmi

     

  3. Remover imagens não utilizadas:

    $ podman imagens | grep -v -e registry.redhat.io -e "quay.io/openshift" -e registry.access.redhat.com -e docker-registry.usersys.redhat.com -e docker-registry.ops.rhcloud.com -e rhmap | xargs --no-run-if-empty podman rmi 2>/dev/null
     
  4. Sair da depuração:

    saída de $
    saída de $

     

Serviço de suporte

Se todas as etapas acima não puderem resolver o problema, entre em contato com o suporte técnico da Dell EMC para investigar mais.

Produits concernés

APEX Cloud Platform for Red Hat OpenShift
Propriétés de l’article
Numéro d’article: 000217422
Type d’article: Solution
Dernière modification: 20 févr. 2026
Version:  3
Trouvez des réponses à vos questions auprès d’autres utilisateurs Dell
Services de support
Vérifiez si votre appareil est couvert par les services de support.