Openshift 事件代码:1038NODE0008

Résumé: 系统内存超出预留

Cet article concerne Cet article ne concerne pas Cet article n’est associé à aucun produit spécifique. Toutes les versions du produit ne sont pas identifiées dans cet article.

Symptômes

特定节点上的系统内存使用量超过预留容量的 95%。

Cause

预留内存可确保即使在节点已完全分配时系统进程也能正常工作,并防止工作负载内存不足事件影响节点的正常运行。

默认预留预计对于大多数配置来说已经足够了,并且在运行具有大量 Pod 的节点(由于更改率或处于稳定状态)时,应增加 (https://docs.openshift.com/container-platform/latest/nodes/nodes/nodes-nodes-managing.html)。

Résolution

诊断

检查每个节点池的 systemReserved 应用于节点的配置: 

$ oc get nodes
[...]
$ oc debug node/[node_name] -- cat /host/etc/kubernetes/kubelet.conf
[...]
systemReserved:
 Cpu:500米
 记忆:1吉
 临时存储:1吉
[...]

检查节点中使用的资源(检查 kubelet runtime 如果要
与配置的 systemReserved 值):

$ oc get --raw /api/v1/nodes/<node>/proxy/stats/summary
[...]
 {
    “node”:{
        “nodeName”:“cluster.node22”,
        “systemContainers”:[
            {
                “cpu”:{
                    “usageCoreNanoSeconds”:929684480915,
                    “usageNanoCores”:190998084
                },
                “memory”:{
                    “rssBytes”:176726016,
                    “usageBytes”:1397895168,
                    “workingSetBytes”:1050509312
                },
                “name”:“kubelet”
            },
            {
                “cpu”:{
                    “usageCoreNanoSeconds”:128521955903,
                    “usageNanoCores”:5928600
                },
                “memory”:{
                    “rssBytes”:35958784,
                    “usageBytes”:129671168,
                    “workingSetBytes”:102416384
                },
                “name”:“运行时”
            }
    [...
            ]
        ]
    }
}
[...]

缓解

增加内存预留以解决此问题。 

例如,要为默认工作线程设置资源分配 MachineConfigPool ,在项目内创建以下 CR openshift-config-operator管理此进程:

警告:这将触发节点的串行重新启动 MachineConfigPool管理此进程: 

apiVersion:machineconfiguration.openshift.io/v1
种类:KubeletConfig
元:
 名称:Set-Allocatable
规范:
 machineConfigPoolSelector:
  matchLabels:
    pools.operator.machineconfiguration.openshift.io/worker:""
 kubeletConfig:
  systemReserved:
    Cpu:500m # 根据需要更换 CPU
    记忆:1512Mi # 在需要时更改内存

支持

如果上述所有步骤都无法解决问题,请联系 Dell EMC 技术支持以进行进一步调查。

Produits concernés

APEX Cloud Platform for Red Hat OpenShift
Propriétés de l’article
Numéro d’article: 000217423
Type d’article: Solution
Dernière modification: 20 févr. 2026
Version:  3
Trouvez des réponses à vos questions auprès d’autres utilisateurs Dell
Services de support
Vérifiez si votre appareil est couvert par les services de support.