VxRail:啟用 HA 失敗並顯示錯誤:「設定叢集所需的映像規格失敗」

摘要: 在 VxRail 叢集上重設 Update Manager (VUM) 資料庫後,vSphere HA 會因為 vLCM depot 中的問題而失敗。

本文章適用於 本文章不適用於 本文無關於任何特定產品。 本文未識別所有產品版本。

症狀

看到的錯誤:

com.vmware.vcIntegrity.lifecycle.EsxImage.SolutionNotFound for com.vmware.vsphere-ha version 8.0.3-XXXXXXXX
HSM manifest not found
setting desired image spec for cluster failed
cannot find vSphere HA master agent

原因

vLCM Depot 中缺少 HA 解決方案,VUM 資料庫中的過時所需狀態項目。

解析度

警示:請先拍攝 vCenter 的快照,然後再繼續。

 

  1. 停止更新管理員:
    service-control --stop vmware-updatemgr
  2. 切換至 VUM 使用者並連線至資料庫:
    su updatemgr -s /bin/bash
    psql -U vumuser -d VCDB
  3. 檢查表(選擇):
    table pm_software_desired_states;
    table pm_software_compliances;
  4. 刪除過時的列:
    1. 全球:
      DELETE FROM pm_software_compliances;
      DELETE FROM pm_software_desired_states;
    2. 或鎖定單一叢集 (取代 DOMAIN-ID):
      DELETE FROM pm_software_compliances
      WHERE desired_state_id IN (
      SELECT desired_state_id FROM pm_software_desired_states
      WHERE entity_id='domain-ID'
      );
      DELETE FROM pm_software_desired_states WHERE entity_id='domain-ID';
      
  5. 離開資料庫並返回到根:
    \q
  6. 重新啟動 Update Manager:
    service-control --start vmware-updatemgr
  7. 重新啟用叢集上的 vSphere HA

 

如果仍然缺少 HA 解決方案

  1. 重新產生 VxRail Manager 憑證 (在 vCenter 上執行):
    /usr/lib/vmware-updatemgr/bin/updatemgr-utility.py install-cert <VxRail-FQDN>
  2. 保證 vlcm_enabled=true 使用 API (在 VxRail Manager 上):
    curl -X PUT -H "Content-Type: application/json" -d '{"value":"true"}' --unix-socket /var/lib/vxrail/nginx/socket/nginx.sock http://127.0.0.1/rest/vxm/internal/configservice/v1/configuration/keys/vlcm_enabled
    
  3. 停用舊版批次升級 (在 VxRail Manager 上),方法是設定: lcmProperties.force.legacy.batch.upgrade=false
    vi /var/lib/vmware-marvin/lcm_advanced_mode.properties
  4. 重新上傳正確的組合套裝,並同步處理維修站。

其他資訊

受影響的產品

VxRail, VxRail Appliance Series, VxRail Software
文章屬性
文章編號: 000370843
文章類型: Solution
上次修改時間: 03 10月 2025
版本:  2
向其他 Dell 使用者尋求您問題的答案
支援服務
檢查您的裝置是否在支援服務的涵蓋範圍內。