OpenShift 事件代碼:1038節點0007

Résumé: 檔案系統預計在接下來的 4 小時內將耗盡空間。

Cet article concerne Cet article ne concerne pas Cet article n’est associé à aucun produit spécifique. Toutes les versions du produit ne sont pas identifiées dans cet article.

Symptômes

隨著文件系統空間開始不足,系統性能通常會逐漸下降。

如果文件系統填滿並耗盡空間,則需要寫入文件系統的進程將無法再執行此操作,這可能會導致數據丟失和系統不穩定。

Cause

可使用 NodeFilesystemSpaceFillingUp 滿足兩個條件時觸發警報:

  • 當前文件系統使用率超過某個閾值。
  • 外推演演演算法預測文件系統將在一定時間內耗盡空間。如果時間段少於 24 小時,則 Warning 警報。如果時間少於 4 小時,這是 Critical 警報。

Résolution

診斷

  • 在儀錶板上研究文件系統使用的最新趨勢。有時,文件系統中的定期寫入和清理模式可能會導致線性預測演演演算法觸發錯誤警報。

  • 使用 Linux 作業系統工具和公用程式,調查哪些目錄在檔案系統中佔用的空間最多。該問題是否為異常狀況,例如進程無法自行清理並使用大量空間?還是這個問題似乎與有機增長有關?

為了説明您進行診斷,請在 PromQL 中觀察以下指標(在 OCP Web 控制臺上執行查詢:觀察→指標→執行查詢):

node_filesystem_free_bytes

然後,檢查 mountpoint 警示的標籤。

緩解

如果 mountpoint 標籤為 /小 /sysroot 或 /var,請移除未使用的影像以解決問題:

  1. 存取節點檔案系統以除錯節點:

    $ NODE_NAME=< 來自警示>的例項標籤
    $ oc -n default debug node/$NODE_NAME
    $ chroot /host

     

  2. 移除懸掛的影像:

    $ podman 圖像 -q -f 懸空=真 |xargs --no-run-if-emptypodman rmi

     

  3. 移除未使用的映像:

    $ 波德曼圖片 |grep -v -e registry.redhat.io -e “quay.io/openshift” -e registry.access.redhat.com -e docker-registry.usersys.redhat.com -e docker-registry.ops.rhcloud.com -e rhmap |xargs --no-run-if-empty, podman rmi 2>/dev/null
     
  4. 結束除錯:

    $ 離開
    $ 離開

     

支援

如果上述所有步驟都無法解決問題,請聯絡 Dell EMC 技術支援部門以進一步調查。

Produits concernés

APEX Cloud Platform for Red Hat OpenShift
Propriétés de l’article
Numéro d’article: 000217422
Type d’article: Solution
Dernière modification: 20 févr. 2026
Version:  3
Trouvez des réponses à vos questions auprès d’autres utilisateurs Dell
Services de support
Vérifiez si votre appareil est couvert par les services de support.