VxRail:由于 EVC 不兼容,第 16 代节点的 L3 节点扩展失败

摘要: 此知识库文章介绍如何解决由于增强的 vMotion 兼容性 (EVC) 不兼容而导致第 16 代节点的 L3 节点扩展失败的问题。

本文适用于 本文不适用于 本文并非针对某种特定的产品。 本文并非包含所有产品版本。

症状

VxRail L3 节点扩展显示不兼容,并显示消息“主机 CPU 与群集 EVC 模式不兼容。要将此主机添加到群集,您需要在 vCenter Web Client 中更改群集 EVC 模型。请参阅KB000228327。

EVC 级别错误导致 L3 节点扩展警报消息

在short.term.log中观察到以下错误消息:

2025-01-31T08:12:57.184Z <3c5202537ca65b8bc8600580dbe6378c> marvin [ERROR] <155> NodeModelChecker.java isEvcCompatible() (229): Incompatible EVC mode. Node EVC mode is lower than current cluster EVC mode

在此之前显示群集 EVC 级别消息:

# same level:
2025-01-31T08:12:57.184Z <3c5202537ca65b8bc8600580dbe6378c> marvin [INFO] <155> NodeModelChecker.java isEvcCompatible() (201): current cluster EVC mode from VC mob: sapphire-rapids

# lower level:
2025-01-31T08:12:57.184Z <3c5202537ca65b8bc8600580dbe6378c> marvin [INFO] <155> NodeModelChecker.java isEvcCompatible() (201): current cluster EVC mode from VC mob: intel-icelake

 

发生错误时,此知识库文章可能不适用。仅当尝试使用 Sapphire-Rapids 节点将 L3 节点扩展到设置为 Sapphire-Rapids EVC 级别或更低级别的群集时,此知识库文章才适用。因此,以下步骤可帮助确认此知识库文章是否有用。

  • 登录到 VxRail Manager (VXM) 并运行以下命令,以确认不兼容型号的代码名称为“Sapphire Rapids”。

从密码箱中查找代码名称。

flloc=$(find /run/k3s/containerd/io.containerd.runtime.v2.task/k8s.io/ -iname hardware-model-specs.json | grep -v lockbox)
grep VP-760 $flloc -A 25

查找代码名称命令的输出屏幕

  • 群集 EVC 为“Sapphire Rapids”

EVC 模式的屏幕截图。

原因

群集和新节点 EVC 为“Sapphire Rapids”,并且 L3 节点扩展失败。

解决方案

登录到 VxM 并运行以下命令,将代码名称从“Sapphire-Rapids”更新为“SapphireRapids”:

更新密码箱中的代码名称。

find /var/lib/rancher/rke2 -iname hardware-model-specs.json -not -path "*lockbox_app*" -exec sed -i 's/Sapphire-Rapids/SapphireRapids/g' {} \; 2>/dev/null
kubectl rollout restart deployment infra-config-service

下一步是重新启动 vmware-marvin 服务管理所有 jukebox 操作。重新启动服务可能会影响正在进行的第 2 天作,例如群集关闭、群集迁移和 L3 节点扩展。在重新启动之前,确保没有其他 Day 2作在进行。

登录到 VxM 并运行以下命令,以确认是否有任何后续作正在进行。如果返回值为空,则 vmware-marvin 服务可以重新启动:

检查是否有任何作锁定。

curl -X GET --unix-socket /var/lib/vxrail/nginx/socket/nginx.sock http://127.0.0.1/rest/vxm/internal/lockservice/v1/lock

登录到 VxM 并运行以下命令以重新启动 vmware-marvin 服务管理所有 jukebox 操作。

更新密码箱中的代码名称。

systemctl restart vmware-marvin

受影响的产品

VxRail, VxRail Appliance Series, VxRail VE-660, VxRail VE-6615, VxRail VP-760, VxRail VP-7625, VxRail VS-760
文章属性
文章编号: 000287941
文章类型: Solution
上次修改时间: 25 9月 2025
版本:  3
从其他戴尔用户那里查找问题的答案
支持服务
检查您的设备是否在支持服务涵盖的范围内。