Code d’événement Openshift : 1038NODE0007

Résumé: Le système de fichiers devrait manquer d’espace dans les 4 prochaines heures.

Cet article concerne Cet article ne concerne pas Cet article n’est associé à aucun produit spécifique. Toutes les versions du produit ne sont pas identifiées dans cet article.

Symptômes

Lorsqu’un système de fichiers commence à manquer d’espace, les performances du système se dégradent progressivement.

Si un système de fichiers se remplit et manque d’espace, les processus qui doivent écrire sur le système de fichiers ne peuvent plus le faire, ce qui peut entraîner la perte de données et l’instabilité du système.

Cause

La commande NodeFilesystemSpaceFillingUp Déclenchement d’une alerte lorsque deux conditions sont remplies :

  • L’utilisation actuelle du système de fichiers dépasse un certain seuil.
  • Un algorithme d’extrapolation prédit que le système de fichiers manquera d’espace dans un certain laps de temps. Si la période est inférieure à 24 heures, il s’agit d’un Warning Alerte. Si la durée est inférieure à 4 heures, il s’agit d’un Critical Alerte.

Résolution

Diagnostic

  • Étudiez les tendances récentes d’utilisation du système de fichiers sur un tableau de bord. Parfois, un modèle périodique d’écriture et de nettoyage dans le système de fichiers peut entraîner le déclenchement d’une fausse alerte par l’algorithme de prédiction linéaire.

  • Utilisez les outils et utilitaires du système d’exploitation Linux pour identifier les répertoires qui utilisent le plus d’espace dans le système de fichiers. S’agit-il d’une condition irrégulière, comme un processus qui ne parvient pas à se nettoyer derrière lui-même et qui utilise une grande quantité d’espace ? Ou le problème semble-t-il être lié à la croissance organique ?

Pour vous aider dans votre diagnostic, observez la métrique suivante dans PromQL (exécutez la requête sur la console Web OCP : Observer → Metrics → exécuter des requêtes) :

node_filesystem_free_bytes

Ensuite, cochez la case mountpoint Libellé de l’alerte.

Atténuation

Si la capacité mountpoint L’étiquette est //sysroot ou /var, supprimez les images inutilisées pour résoudre le problème :

  1. Déboguez le nœud en accédant au système de fichiers du nœud :

    $ NODE_NAME=<libellé d’instance de l’alerte>
    $ oc -n default debug node/$NODE_NAME
    $ chroot /host

     

  2. Pour supprimer les images pendantes :

    $ podman images -q -f dangling=true | xargs --no-run-if-empty podman rmi

     

  3. Supprimez les images inutilisées :

    $ images de podman | grep -v -e registry.redhat.io -e « quay.io/openshift » -e registry.access.redhat.com -e docker-registry.usersys.redhat.com -e docker-registry.ops.rhcloud.com -e rhmap | xargs --no-run-if-empty podman rmi 2>/dev/null
     
  4. Quittez le débogage :

    $ exit
    $ exit

     

Support

Si toutes les étapes ci-dessus ne permettent pas de résoudre le problème, contactez le support technique Dell EMC pour une procédure d’enquête plus approfondie.

Produits concernés

APEX Cloud Platform for Red Hat OpenShift
Propriétés de l’article
Numéro d’article: 000217422
Type d’article: Solution
Dernière modification: 20 févr. 2026
Version:  3
Trouvez des réponses à vos questions auprès d’autres utilisateurs Dell
Services de support
Vérifiez si votre appareil est couvert par les services de support.