Openshift 事件代码:1038NODE0008
Résumé: 系统内存超出预留
Cet article concerne
Cet article ne concerne pas
Cet article n’est associé à aucun produit spécifique.
Toutes les versions du produit ne sont pas identifiées dans cet article.
Symptômes
特定节点上的系统内存使用量超过预留容量的 95%。
Cause
预留内存可确保即使在节点已完全分配时系统进程也能正常工作,并防止工作负载内存不足事件影响节点的正常运行。
默认预留预计对于大多数配置来说已经足够了,并且在运行具有大量 Pod 的节点(由于更改率或处于稳定状态)时,应增加 (https://docs.openshift.com/container-platform/latest/nodes/nodes/nodes-nodes-managing.html)。
Résolution
诊断
检查每个节点池的 systemReserved 应用于节点的配置:
$ oc get nodes [...] $ oc debug node/[node_name] -- cat /host/etc/kubernetes/kubelet.conf [...] systemReserved: Cpu:500米 记忆:1吉 临时存储:1吉 [...] |
检查节点中使用的资源(检查 kubelet 和 runtime 如果要
与配置的 systemReserved 值):
$ oc get --raw /api/v1/nodes/<node>/proxy/stats/summary
[...]
{
“node”:{
“nodeName”:“cluster.node22”,
“systemContainers”:[
{
“cpu”:{
“usageCoreNanoSeconds”:929684480915,
“usageNanoCores”:190998084
},
“memory”:{
“rssBytes”:176726016,
“usageBytes”:1397895168,
“workingSetBytes”:1050509312
},
“name”:“kubelet”
},
{
“cpu”:{
“usageCoreNanoSeconds”:128521955903,
“usageNanoCores”:5928600
},
“memory”:{
“rssBytes”:35958784,
“usageBytes”:129671168,
“workingSetBytes”:102416384
},
“name”:“运行时”
}
[...
]
]
}
}
[...]
|
缓解
增加内存预留以解决此问题。
例如,要为默认工作线程设置资源分配 MachineConfigPool ,在项目内创建以下 CR openshift-config-operator管理此进程:
警告:这将触发节点的串行重新启动 MachineConfigPool管理此进程:
apiVersion:machineconfiguration.openshift.io/v1
种类:KubeletConfig
元:
名称:Set-Allocatable
规范:
machineConfigPoolSelector:
matchLabels:
pools.operator.machineconfiguration.openshift.io/worker:""
kubeletConfig:
systemReserved:
Cpu:500m # 根据需要更换 CPU
记忆:1512Mi # 在需要时更改内存 |
支持
如果上述所有步骤都无法解决问题,请联系 Dell EMC 技术支持以进行进一步调查。
Produits concernés
APEX Cloud Platform for Red Hat OpenShiftPropriétés de l’article
Numéro d’article: 000217423
Type d’article: Solution
Dernière modification: 20 févr. 2026
Version: 3
Trouvez des réponses à vos questions auprès d’autres utilisateurs Dell
Services de support
Vérifiez si votre appareil est couvert par les services de support.