VxRail: Z důvodu nekompatibility EVC selže rozšíření uzlu L3 o 16G uzel
Shrnutí: Tento článek znalostní databáze popisuje, jak vyřešit selhání rozšíření uzlu L3 o uzel 16G kvůli nekompatibilitě EVC (Enhanced vMotion Compatibility).
Příznaky
Rozšíření uzlu VxRail L3 se zobrazuje jako nekompatibilní se zprávou "The host CPU is not compatible with the cluster EVC mode. Chcete-li přidat tohoto hostitele do clusteru, musíte změnit model EVC clusteru v prostředí vCenter Web Client. Viz KB000228327."
V short.term.log se zobrazí následující chybová zpráva:
2025-01-31T08:12:57.184Z <3c5202537ca65b8bc8600580dbe6378c> marvin [ERROR] <155> NodeModelChecker.java isEvcCompatible() (229): Incompatible EVC mode. Node EVC mode is lower than current cluster EVC mode
Tomu předchází zpráva na úrovni EVC clusteru:
# same level: 2025-01-31T08:12:57.184Z <3c5202537ca65b8bc8600580dbe6378c> marvin [INFO] <155> NodeModelChecker.java isEvcCompatible() (201): current cluster EVC mode from VC mob: sapphire-rapids # lower level: 2025-01-31T08:12:57.184Z <3c5202537ca65b8bc8600580dbe6378c> marvin [INFO] <155> NodeModelChecker.java isEvcCompatible() (201): current cluster EVC mode from VC mob: intel-icelake
Pokud dojde k chybě, tento článek znalostní databáze se nemusí použít. Tento článek znalostní databáze je použitelný pouze při pokusu o rozšíření uzlu L3 pomocí uzlu Sapphire-Rapids do clusteru nastaveného na úroveň EVC Sapphire-Rapids nebo nižší. Proto následující kroky mohou pomoci potvrdit, zda je tento článek znalostní databáze užitečný.
- Přihlaste se do nástroje VxRail Manager (VXM) a spuštěním následujícího příkazu potvrďte, že kódové označení nekompatibilního modelu je "Sapphire Rapids".
Vyhledejte kódové jméno z bezpečnostního modulu.
flloc=$(find /run/k3s/containerd/io.containerd.runtime.v2.task/k8s.io/ -iname hardware-model-specs.json | grep -v lockbox) grep VP-760 $flloc -A 25

- Přístrojová deska EVC je "Sapphire Rapids"

Příčina
Řešení
Přihlaste se do VxM a spuštěním následujícího příkazu aktualizujte kódový název z "Sapphire-Rapids" na "SapphireRapids":
Aktualizujte kódový název v bezpečnostním poli.
find /var/lib/rancher/rke2 -iname hardware-model-specs.json -not -path "*lockbox_app*" -exec sed -i 's/Sapphire-Rapids/SapphireRapids/g' {} \; 2>/dev/null
kubectl rollout restart deployment infra-config-service
Dalším krokem je restartování vmware-marvin . Restartování služby může ovlivnit probíhající operace 2. dne, jako je vypnutí clusteru, migrace clusteru a rozšíření uzlu L3. Před restartováním se ujistěte, že neprobíhají žádné další operace Dne 2.
Přihlaste se do VxM a spuštěním následujícího příkazu ověřte, zda probíhají nějaké operace 2. dne. Je-li vrácená zásilka prázdná, pak vmware-marvin Službu lze restartovat:
Zkontrolujte, zda nedochází k provoznímu zámku.
curl -X GET --unix-socket /var/lib/vxrail/nginx/socket/nginx.sock http://127.0.0.1/rest/vxm/internal/lockservice/v1/lock
Přihlaste se k nástroji VxM a spuštěním následujícího příkazu restartujte vmware-marvin .
Aktualizujte název kódu v bezpečnostním modulu.
systemctl restart vmware-marvin