VxRail:由於 EVC 不相容,L3 節點擴充搭配 16g 節點失敗

摘要: 本知識文章說明如何解決因增強型 vMotion 相容性 (EVC) 不相容而導致的 L3 節點擴充搭配 16G 節點失敗問題。

本文章適用於 本文章不適用於 本文無關於任何特定產品。 本文未識別所有產品版本。

症狀

VxRail L3 節點擴充顯示不相容訊息「主機 CPU 與叢集 EVC 模式不相容。若要將此主機新增至叢集,您必須在 vCenter Web Client 中變更叢集 EVC 機型。參考KB000228327。

L3 節點擴充顯示錯誤 EVC 層級的訊息

在short.term.log中觀察到以下錯誤訊息:

2025-01-31T08:12:57.184Z <3c5202537ca65b8bc8600580dbe6378c> marvin [ERROR] <155> NodeModelChecker.java isEvcCompatible() (229): Incompatible EVC mode. Node EVC mode is lower than current cluster EVC mode

這之前會顯示叢集 EVC 層級訊息:

# same level:
2025-01-31T08:12:57.184Z <3c5202537ca65b8bc8600580dbe6378c> marvin [INFO] <155> NodeModelChecker.java isEvcCompatible() (201): current cluster EVC mode from VC mob: sapphire-rapids

# lower level:
2025-01-31T08:12:57.184Z <3c5202537ca65b8bc8600580dbe6378c> marvin [INFO] <155> NodeModelChecker.java isEvcCompatible() (201): current cluster EVC mode from VC mob: intel-icelake

 

發生錯誤時,此 KB 可能不適用。只有當嘗試使用 Sapphire Rapids 節點將 L3 節點擴充至設為 Sapphire Rapids EVC 層級或更低的叢集時,才適用此 KB。因此,下列步驟可協助確認此 KB 是否有用。

  • 登入 VxRail Manager (VXM) 並執行下列命令,以確認代碼名稱為不相容型號的「Sapphire Rapids」。

從密碼箱中找到代碼名稱。

flloc=$(find /run/k3s/containerd/io.containerd.runtime.v2.task/k8s.io/ -iname hardware-model-specs.json | grep -v lockbox)
grep VP-760 $flloc -A 25

尋找代碼名稱命令的輸出畫面

  • 叢集 EVC 為「Sapphire Rapids」

EVC 模式的螢幕擷取畫面。

原因

叢集和新節點 EVC 為「Sapphire Rapids」,L3 節點擴充失敗。

解析度

登入 VxM 並執行下列命令,將代碼名稱從「Sapphire-Rapids」更新為「SapphireRapids」:

更新加密箱中的代碼名稱。

find /var/lib/rancher/rke2 -iname hardware-model-specs.json -not -path "*lockbox_app*" -exec sed -i 's/Sapphire-Rapids/SapphireRapids/g' {} \; 2>/dev/null
kubectl rollout restart deployment infra-config-service

下一步是重新啟動 vmware-marvin 服務。重新啟動服務可能會影響正在進行的第 2 天作業,例如叢集關機、叢集遷移和 L3 節點擴充。在重新開機之前,請確保沒有其他第 2 天作業正在進行中。

登入 VxM 並執行下列命令,以確認是否有任何第 2 天的作業正在進行中。如果退貨為空,則 vmware-marvin 服務可以重新啟動:

檢查是否有任何作業鎖定。

curl -X GET --unix-socket /var/lib/vxrail/nginx/socket/nginx.sock http://127.0.0.1/rest/vxm/internal/lockservice/v1/lock

登入 VxM 並執行下列命令,以重新開機 vmware-marvin 服務。

更新加密箱中的代碼名稱。

systemctl restart vmware-marvin

受影響的產品

VxRail, VxRail Appliance Series, VxRail VE-660, VxRail VE-6615, VxRail VP-760, VxRail VP-7625, VxRail VS-760
文章屬性
文章編號: 000287941
文章類型: Solution
上次修改時間: 25 9月 2025
版本:  3
向其他 Dell 使用者尋求您問題的答案
支援服務
檢查您的裝置是否在支援服務的涵蓋範圍內。