Openshift 事件代码:1038NODE0007

Résumé: 预计文件系统将在接下来的 4 小时内耗尽空间。

Cet article concerne Cet article ne concerne pas Cet article n’est associé à aucun produit spécifique. Toutes les versions du produit ne sont pas identifiées dans cet article.

Symptômes

随着文件系统的空间开始减少,系统性能通常会逐渐下降。

如果文件系统已满并且空间不足,则需要写入文件系统的进程将无法再这样做,这可能会导致数据丢失和系统不稳定。

Cause

而 NodeFilesystemSpaceFillingUp 满足两个条件时会触发警报:

  • 当前文件系统使用率超过特定阈值。
  • 外推算法预测文件系统将在一定时间内耗尽空间。如果时间段少于 24 小时,则为 Warning 警报。如果时间少于 4 小时,则为 Critical 警报。

Résolution

诊断

  • 在控制面板上研究文件系统使用的最新趋势。有时,文件系统中的周期性写入和清理模式可能会导致线性预测算法触发误报。

  • 使用 Linux作系统工具和实用程序调查哪些目录占用了文件系统中最多的空间。问题是否为异常情况(例如进程无法自行清理并使用大量空间)?或者这个问题似乎与有机增长有关?

为了帮助您进行诊断,请观察 PromQL(在 OCP Web 控制台上执行查询)中的以下指标:观察→指标→运行查询):

node_filesystem_free_bytes

然后,检查 mountpoint 警报的标签。

缓解

如果 mountpoint 标签为 /开始, /sysroot 或 /var,请删除未使用的映像以解决此问题:

  1. 通过访问节点文件系统来调试节点:

    $ NODE_NAME=<来自警报>的实例标签
    $ oc -n default debug node/$NODE_NAME
    $ chroot /host

     

  2. 删除悬空图像:

    $ podman images -q -f dangling=true |xargs --no-run-if-empty podman rmi

     

  3. 删除未使用的映像:

    $ Podman 图片 |grep -v -e registry.redhat.io -e “quay.io/openshift” -e registry.access.redhat.com -e docker-registry.usersys.redhat.com -e docker-registry.ops.rhcloud.com -e rhmap |xargs --no-run-if-empty podman rmi 2>/dev/null
     
  4. 退出调试:

    $ exit
    $ exit

     

支持

如果上述所有步骤都无法解决问题,请联系 Dell EMC 技术支持以进行进一步调查。

Produits concernés

APEX Cloud Platform for Red Hat OpenShift
Propriétés de l’article
Numéro d’article: 000217422
Type d’article: Solution
Dernière modification: 20 févr. 2026
Version:  3
Trouvez des réponses à vos questions auprès d’autres utilisateurs Dell
Services de support
Vérifiez si votre appareil est couvert par les services de support.