OpenShift 事件代碼:1038節點0008

Résumé: 系統記憶體超過保留時間

Cet article concerne Cet article ne concerne pas Cet article n’est associé à aucun produit spécifique. Toutes les versions du produit ne sont pas identifiées dans cet article.

Symptômes

特定節點上的系統記憶體使用量超過預留的 95%。

Cause

保留記憶體可確保即使節點已完全分配,系統進程也能正常運行,並防止影響節點正常運行的工作負載記憶體不足事件。

默認預留預計足以滿足大多數配置,並且應在運行具有大量 Pod 的節點時增加 (https://docs.openshift.com/container-platform/latest/nodes/nodes/nodes-nodes-managing.html)(由於更改率或處於穩定狀態)。

Résolution

診斷

檢查 systemReserved 套用至節點的組態: 

$ OC get 節點
[...]
$ oc debug node/[node_name] -- cat /host/etc/kubernetes/kubelet.conf
[...]
系統保留:
 中央處理器:500米
 記憶體:1吉
 暫時儲存:1吉
[...]

檢查節點中使用的資源 (檢查 kubelet runtime
如果您要與 systemReserved 值):

$ oc get --raw /api/v1/nodes/<nodes>/proxy/stats/summary
[...]
 {
    「節點」:{
        「nodeName」:“cluster.node22”,
        「systemContainers」:[
            {
                「CPU」:{
                    「usageCoreNanoSeconds」:929684480915,
                    “usageNanocorees”:190998084
                },
                「memory」:{
                    「rssBytes」:176726016,
                    「usageBytes」:1397895168,
                    「workingSetBytes」:1050509312
                },
                「name」:“庫貝萊特”
            },
            {
                「CPU」:{
                    「usageCoreNanoSeconds」:128521955903,
                    “usageNanocorees”:5928600
                },
                「memory」:{
                    「rssBytes」:35958784,
                    「usageBytes」:129671168,
                    「workingSetBytes」:102416384
                },
                「name」:「執行階段」
            }
    [...
            ]
        ]
    }
}
[...]

緩解

增加記憶體保留以解決問題。 

例如,為預設工作線程設置資源分配 MachineConfigPool ,在項目內創建以下CR openshift-config-operator

警告:這會觸發使用此功能的節點序列重新開機 MachineConfigPool: 

api版本:machineconfiguration.openshift.io/v1
種類:KubeletConfig
中繼資料:
 名稱:可設定可分配
規格:
 machineConfigPoolSelector:
  符合標籤:
    pools.operator.machineconfiguration.openshift.io/worker:""
 kubeletConfig:
  系統保留:
    中央處理器:500m # 如有需要,更換 CPU
    記憶體:1512Mi # 如有需要,請更換記憶體

支援

如果上述所有步驟都無法解決問題,請聯絡 Dell EMC 技術支援部門以進一步調查。

Produits concernés

APEX Cloud Platform for Red Hat OpenShift
Propriétés de l’article
Numéro d’article: 000217423
Type d’article: Solution
Dernière modification: 20 févr. 2026
Version:  3
Trouvez des réponses à vos questions auprès d’autres utilisateurs Dell
Services de support
Vérifiez si votre appareil est couvert par les services de support.